编程 新 手 学 Python 之 无 痛 起 步 
精心 设计 的 循序 渐进 课程 











讲 租 @ 示例 @ 动手 练习 @ 项 目 实践 M2 
手把手 教学 ， 通 俗 易 懂 ， 生 动 有 趣 4 

















Python 3.5 


从 地 开始 学 


刘 宇 宙 编著 


渡 著 大 学 出 版 社 


cones Python 3.5 
55505 从 零 开 始 学 


刘 宇 宙 编著 


渡 革 大 党 出 版 社 
北 京 


本 书 专门 针对 Python 新 手 量 身 定做 ， 涵 盖 了 Python 3 实际 开发 的 重要 知识 点 ， 内 容 包 括 : Python 语言 的 类 型 
和 对 象 、 操 作 符 和 表达 式 、 编 程 结 构 和 控制 流 、 函 数 、 序 列 、 多 线程 、 正 则 表达 式 、 面 向 对 象 编程 、 文 件 操作 、 网 络 
编程 、 邮 件 收发 、 数 据 库 操作 等 ， 提 供 Python 仆 虫 、 数 据 处 理 项 目 范例 ， 各 章 还 安排 了 调试 、 问 题解 答 、 温 故 知 新 、 
牛 九 小 试 等 内 容 ， 以 帮助 读者 学 会 处 理 程序 异常 、 解 答 学 习 困 惑 、 巩 固 知识 、 学 以 致 用 。 

本 书 通 俗 易 懂 、 示 例 丰 富 、 代 码 可 读 性 及 可 操作 性 强 。 非 常 适合 Python 3. x 初学 者 、 想 学 习 和 了 解 Python 3 
的 程序 员 ， 也 可 作为 Python 网 课 、 培 训 及 大 专 院 校 教学 用 书 。 


本 书 封面 贴 有 清华 大 学 出 版 社 防 伪 标签 ， 无 标签 者 不 得 销售 。 
版 权 所 有 ， 侵 权 必 究 。 侵 权 举 报 电话 : 010-62782989 13701121933 


图 书 在 版 编目 (CIP) 数据 


Python 3. 5 从 零 开始 学 / 刘 宇 宙 编 著 . 一 北京 : 清华 大 学 出 版 社 ，2017 (2017. 11 重印 ) 
ISBN 978-7-302-47596-5 


I，@OP… I.， @ 刘 … 了 三，@ 软 件 工具 一 程序 设计 I. QTP311. 561 


中 国 版 本 图 书馆 CIP 数据 核 字 (2017) 第 153447 号 


责任 编辑 ， 王 金 柱 
封面 设计 : 王 翔 
责任 校对 : 闫 秀 华 
责任 印 制 : 宋 林 


出 版 发 行 : 清华 大 学 出 版 社 
网 址 : http://www. tup. com. cn, http://www. wqbook. com 
地 址 : 北京 清华 大 学 学 研 大 厦 A 座 邮 编 : 100084 
社 总 机 : 010-62770175 邮 购 : 010-62786544 
投稿 与 读者 服务 : 010-62776969，c-service@tup. tsinghua. edu. cn 
质 量 反 馈 : 010-62772015，zhiliangetup. tsinghua. edu. cn 


潭 


村 淡泊 讨 获 距 


: 清华 大 学 印刷 厂 

: 全 国 新 华 书店 

: 190mmX 260mm 印 ” 张 : 24.25 字 ” 数 : 620 千 字 

: 2017 年 8 月 第 1 版 印 ”次 : 2017 年 11 月 第 4 次 印刷 
: 7001~10000 

59. 00 元 


半 导 对 六 及 如 





3 
到 
游 
由 


: 072389-01 


了 


前 


什么 是 Python， 你 为 什么 要 使 用 它 ? 

Python 是 一 种 解释 型 的 、 面 向 对 象 的 、 带 有 动态 语义 的 高 级 程序 设计 语言 。 这 里 有 
术语 ， 你 可 以 在 阅读 本 书 的 过 程 中 逐渐 弄 懂 。 

Python 是 一 种 使 你 在 编程 时 能 够 保持 自己 风格 的 程序 设计 语 ， 使 用 它 你 可 以 使 用 清晰 易 
懂 的 程序 来 实现 你 想 要 的 功能 。 并 且 如 果 你 之 前 没有 任何 编程 经 历 ， 那 么 既 简 单 又 强大 的 
Python 就 是 你 入 门 的 完美 选择 。 

伴随 着 云 计算 、 大 数据 等 技术 的 迅速 崛起 ,市场 对 Python 人 才 的 需求 和 市 场 人 才 的 匮乏 ， 
让 长 期 沉默 的 Python 语言 一 下 子 备 受众 人 的 关注 ， 本 书 可 说 是 应 运 而 生 ， 另 外 ， 目 前 Python 
广泛 使 用 的 是 2.7 版 本 ， 新 版 本 Python 3.5 带 来 了 很 多 新 特性 ， 本 书 是 以 Python 3.5 版 本 编写 
而 成 的 ， 对 于 想 学 习 和 了 解 Python 3.5 的 使 用 和 特性 的 读者 ， 本 书 可 以 说 是 最 佳 选择 。 


本 书 的 特色 





很 多 


本 书 专门 针对 Python 新 手 量 身 定做 , 是 编者 学 习 和 使 用 Python 开发 过 程 中 的 体会 和 经 验 
总 结 ， 涵 盖 了 实际 开发 中 所 有 的 重要 知识 点 ， 内 容 详 尽 ， 代 码 可 读 性 及 可 操作 性 强 。 

本 书 主要 介绍 了 Python 语言 的 类 型 和 对 象 、 操 作 符 和 表达 式 、 编 程 结构 和 控制 流 、 函 数 、 
序列 、 多 线程 、 正 则 表达 式 、 面 向 对 象 编程 、 文 件 操作 、 网 络 编程 、 邮 件 收 发 、 数 据 库 操作 等 ， 
并 安排 了 Python 爬虫 、 数 据 处 理 项 目 范例 ， 各 章 还 安排 了 调试 、 问 题解 答 、 温 故 知 、 牛 九 小 
试 等 章节 实例 等 内 容 ， 以 帮助 读者 学 会 处 理 程序 异常 、 解 答 学 习 困 惑 、 巩 固 知识 、 学 以 致 用 。 

本 书 的 另 一 个 特色 是 , 使 用 通俗 易 懂 的 描述 和 丰富 的 示例 代码 , 并 结合 日 常生 活 中 的 一 些 
小 事件 ， 使 本 书 读 起 来 尽 可 能 生动 有 趣 ， 让 复杂 的 问题 以 简单 的 形式 展现 出 来 ， 使 读者 学 来 轻 
松 ， 充 分 感受 到 学 习 Python 的 乐趣 和 魅力 。 


本 书 的 内 容 


本 书 共 分 18 章 ， 各 章 内 容 安排 如 下 : 

第 1 章 主 要 介绍 Python 的 起 源 、 应 用 场合 、 前 景 以 及 Python 3 相对 于 Python 2 的 一 些 新 
特性 。 

第 2 章 主要 介绍 Python 的 基础 知识 ， 为 后 续 章 节 学 习 相 关内 容 做 铺垫 。 

第 3 章 将 重点 介绍 列表 和 元 组 。 

第 4 章 将 重点 介绍 字符 串 的 格式 化 、 分 割 、 搜 索 等 方法 。 

第 5 章 将 介绍 字典 ， 字 典 是 一 种 通过 名 字 引 用 值 的 数据 结构 。 

第 6 章 从 import 语句 开始 介绍 ， 然 后 逐步 深入 介绍 条 件 语句 、 循 环 语句 以 及 列表 推导 式 
等 一 些 更 深层 次 的 语句 。 


第 7 章 主要 介绍 函数 ,函数 是 组 织 好 的 、 可 重复 使 用 的 ， 用 来 实现 单一 或 相关 联 功能 的 代 
码 段 。 

第 8 章 主要 介绍 Python 面向 对 象 编程 的 特性 , Python 从 设计 之 初 就 是 一 门面 向 对 象 语言 ， 
它 提 供 一 些 语言 特性 支持 面向 对 象 编程 。 

第 9 章 将 带领 读者 学 习 如 何 处 理 各 种 异常 ， 以 及 创建 和 自 定义 异常 。 

第 10 章 将 具体 讲解 Python 中 日 期 和 时 间 的 使 用 。 

第 11 章 主要 介绍 正则 表达 式 的 基本 使 用 。 

第 12 章 主要 介绍 如 何 使 用 Python 在 硬盘 上 创建 、 读 取 和 保存 文件 。 

第 13 章 主要 介绍 Python 中 的 多 线程 编程 。 

第 14 章 主要 介绍 如 何 使 用 Python 语言 发 送 和 接收 邮件 。 

第 15 章 将 重点 介绍 Python 在 网 络 编程 方面 的 特性 。 

第 16 章 将 重点 介绍 在 Python 3.5 中 使 用 PyMySQL 连接 数据 库 , 并 实现 简单 的 增 、 删 、 改 、 查 。 

第 17 章 将 根据 前 面 所 学 讲解 一 个 仆 虫 的 实战 项 目 。 

第 18 章 将 结合 大 数据 的 相关 思维 ， 使 用 已 有 数据 做 一 些 简 单 的 数据 分 析 。 


读者 对 象 





Python 3.x 初学 者 。 
想 学 习 和 了 解 Python 的 程序 员 。 
Python 网 课 、 培 训 及 大 专 院 校 教学 用 书 。 


致谢 
在 本 书 交 稿 之 际 ， 感 谢 清华 大 学 出 版 社 的 王 金 柱 编辑 ,在 本 书 编写 的 过 程 中 ， 王 编辑 给 予 


了 很 多 指导 和 修改 意见 。 同 时 感谢 家 人 和 朋友 在 写作 期 间 给 予 的 安静 写作 环境 , 让 笔者 不 被 更 
多 琐事 打扰 ， 从 而 专心 于 写作 。 感 谢 你 们 ， 没 有 你 们 的 帮助 与 关心 ， 本 书 不 能 如 期 完成 。 





技术 群 及 问题 解答 方式 


Python 技术 服务 qq 群 : 634027520 
CSDN 技术 博客 : youzhouliu 
技术 问答 email: jxgzyuzhouliu@163.com 


编 者 
2017 年 3 月 


第 1 章 进入 Python 3.5 的 精彩 世界 oooooooooooooooooooooooooooooooooooooooooooooooooooooooooeoooeeeoee | 


| 
12 
13 
14 
1s 


1.6 
让 
1.8 
1.9 


Python 的 起 源 …- 
Python 的 应 用 场合 … 
从 2.7 到 3.5，Python 的 新 特性 
如 何 学 习 Python- 
Python 环境 构建 
1.5.1 在 Windows 系统 中 安装 Python 
1.5.2 在 Linux 和 UNIX 系统 中 安装 Python 
1.5.3 在 Mac OS 系统 中 安装 Python 
1.5.4 其 他 版 本 … 























温 故 知 新 ， 学 以 致 用 


第 2 章 开启 Python 之 话 呈 ee 22 


2.1 


22 


3 





认识 程序 … 


运算 符 和 操作 对 和 象 … 


2.6.1 “什么 是 运算 符 和 操作 对 象 
2.6.3 
2.6.4 
2.6.5 
2.6.6 
2.6.7 
2.6.8 





Python 3.5 从 零 开始 学 








2.11 温 故 知 新 ， 学 以 致 用 

第 3 章 ”列表 和 元 组 … 
3.1 通用 序列 操作 

34.1 

12 





















3.1.5 ”成员 资格 … ey 
3.1.6 i 最 小 人 和 最 大 信 - 
3.2 列表 
32.1 更 新 列表 
恢 套 列表 





33 


3.7 温 故 知 新 ， 学 以 致 用 、 


第 4 章 字符 串 … “81 
4.1 字符 串 的 基本 操作 


42 ”字符 串 格 式 化 …… 
4.2.1 


43.1 find0 方 法 
4.3.2 join() 方 法 … 
4.3.3 lower() 方 法 
4.3.4 upper() 方 法 … 
4.3.5 swapcase() 方 法 … 
replace() 方 法 





4.6 温 故 知 新 ， 学 以 致 用 - 

































第 5 章 
5.1 
5.2 ”创建 和 使 用 字典 
5.2.1 dict 函数 …- 
5.2.2 字典 的 基本 操作 
5.2.3 字典 的 格式 化 字符 串 … 
5.2.4 字典 和 列表 的 区 别 - 
setdefault() 方 法 … 
5.3.9 update() 方 法 … 
5.3.10 values( 方 法 : 
5.4 调试 … 
5.5 问题 解 


5.6 温 故 知 新 ， 学 以 致 用 


第 6 章 ， 条件、 循环 和 其 他 语句 … 
6.1 ”使 用 文本 编辑 器 
6.2 import 的 使 用 …… 
6.2.1 import 语句 
6.2.2 ”使 用 逗号 输出 
6.3 


64 i 
6.5 
6.5.1 布尔 变量 的 作用 
6.5.2 让 语 句 … 
else 子 句 


6.6 





跳出 循环 … 





Python 3.5 从 零 开始 学 





i Wn 












6.8 ”牛刀 小 试 一 猜 字 游 戏 编写 
6.9 Python 程序 调试 
6.10 “问题 解答 
6.11 温 故 知 新 ， 学 以 致 用 





992 
7.3.3 默认 参数 … 
7.3.4 可 变 参 数 
7.3.5 组 合 参数 … 































74 
5 
76 

7.6.1 

7.6.2 全 局 变量 … 
7.7 有 返回 值 和 无 返回 值 函数 
7.9 返回 函数 … 
7.10 ii 
7.11 
殉 作 
713 
7.14 
.15 


7.16 温 故 知 新 ， 学 以 致 用 


第 8 章 面向 对 象 编程 
8.1 理解 面向 对 象 
8.1.1 什么 是 面向 对 象 编程 … 
8.1.2 面向 对 象 术语 简介 - 

8.2 类 的 定义 与 使 用 
8.2.1 类 的 定义 … 
8.2.2 ”类 的 使 用 
8.3.1 类 的 构造 方法 
8.3.2 类 的 访问 权限 

8.4 继承 … 
8.5 多 态 
8.6 ”封装 … 
8.7 多 重 继承 …… 
8.8 获取 对 象 信息 - 








8.9 
8.10 
8.11 


9.1 


第 10 章 日 期 和 时 间 


10.1 


10.2 


10.3 
10.4 
10.5 
10.6 
10.7 


第 11 章 正则 表达 式 


11.1 
11.2 


牛刀 小 试 一 一 出 行 建议 







什么 是 异常 








finally 子 句 … 




























异常 和 函数 
bug 的 由 来 … 
温 故 知 新 ， 学 以 致 用 


日 期 和 时 间 
10.1.1 时 间 戳 
10.1.2 时间 格 式 化 符号 
10.1.3 struct_ time 元 组 
time 模块 …… 
10.2.1 time() 函 数 
10.2.2 localtime([secs]) 函 数 、 
10.2.3 ”gmtime([secs]) 函 数 
10.2.4 ”mktime(t) 函 数 … 
10.2.5 ”asctime([t]) 函 数 
10.2.6 ”ctime([secs]) 函 数 … 
10.2.7 sleep(secs) 函 数 
10.2.8 clock0 函 数 …… 
10.2.9 strftime(format[, 4]) 函 数 
10.2.10 ”strptime(string[, format]) 函 数 
10.2.11 三 种 时 间 格 式 转化 
datetime 模块 





日 历 模块 …… 
牛刀 小 试 一 时 间 大 杂烩 
调试 

温 故 知 新 ， 学 以 臻 用 








认识 正则 表达 式 
re 模块 
11.2.1 rematch 函数 





Python 3.5 从 零 开始 学 





11.2.2 re.search 方法 
11.2.3 rematch 与 re.search 的 区 别 
11.3” 贪 禁 模 式 和 非 贪 禁 模 式 …………… 
11.4 替换 … 
11.5 编译 
11.6 温 故 知 新 ， 学 以 致 用 


第 12 章 文件 操作 
12.1 打开 文件 
12.1.1 文件 模式 
12.12 缓冲 … 

12.2 基本 文件 方法 … 
12.2.1 读 和 和 写 
1222 读 写 行 … 
12.2.3 关闭 文件 
12.2.4 ”文件 重 命名 
12.2.5 删除 文件 

12.3 ”对 文件 内 容 进 行 和 迭代 … 
12.3.1 按 字 节 处 理 、 
12.323 按 行 操作 EE 
12.3.3 ”使 用 fileinput 实现 懒 加 载 式 迭 代 … 

12.3.4 ”文件 迭代 器 

12.4 StringIO 函数 …… 
12.5 ”序列 化 与 反 序列 化 

































12.6 
12.7 
12.8 


第 13 章 
13.1 线程 和 进程 … 


13.13 和 学， 和 
13.2 ”使 用 线程 … 
13.2.1 全 局 解释 器 锁 - 
13.2.2 退出 线程 … 
13.2.3 ”Python 的 线程 模块 … 
13.3 ”_thread 模块 
13.4 ”threading 模块 … 
13.5 
13.6 名 
13.7 ”线程 与 进程 比较 … 
13.7.1 ”线程 切换 : 
13.72 on lio 
13.73 异步 I0… - 
















| 
13.9 i 
13.10 温 故 知 新 ， 学 以 致 用 


第 14 章 “发送 和 接收 电子 邮件 
14.1 ”电子 邮件 介绍 ……… 
14.2 发送 邮件 

14.2.1 
14.2.2 发 送 HTML 格式 的 邮件 
14.2.3 
14.2.4 
14.2.5 
14.2.6 
14.3 ”POP3 接收 邮件 ………… 
14.3.1 POP3 下 载 邮 件 
































14.4 
14.5 ”问题 解答 
14.6 温 故 知 新 ， 学 以 致 用 


第 15 章 网 络 编程 bonsossoosssssoossostosdoooaoo0oaeostososeostsssatessatasddatebo 上 sooasassasaasnasassasat tas 
15.1 网络 编程 初 识 
15.2 ”TCP/IP 简介 -… 
15.3 ”网 络 设计 模块 … 

15.3.1 Socket 简介 … 
15.3.2 ”socket 模块 … 
15.3.3 ”socket 对 象 ( 内 建 ) 方法 : 
15.4 ”TCP 编程 
15.4.1 客户 端 
15.4.2 ”服务 器 . 
15.5 UDP 编程 - 
15.6 urllib 模块 
15.6.1 GET 请 求 
15.6.2 POST 请 求 

















15.8 问题 解答 … - 
15.9 温 故 知 新 ， 学 以 致 用 


第 16 章 ”操作 数据 库 … 


16.1 数据 库 介 绍 … 
16.2 ”Python 数据 库 API 
16.2.1 全 局 变量 … 

















16.2.3 ”连接 和 游标 
16.2.4 类 型 


16.3 数据库 操 作 … 
16.3.1 数据 库 连接 
16.3.2 ”创建 数据 库 表 … 





Python 3.5 从 零 开 始 学 





16.3.3 ”数据 库 插入 - 
16.34 ”数据 库 查询 
16.3.5 数据库 更 新 - 




























16.4 
16.5 
16.6 
16.7 


17.1 
17.2 
17.3 


17.3.2 ”使 用 代理 服务 器 
17.3.3 ”cookie 处 理 …… 
17.34 ”伪装 成 浏览 器 


17.4 ”爬虫 示例 
17.4.1 
17.42 页 
17.43 
17.44 
17.4.5 


第 18 章 ， 项目 实 战 一 数据 分 析 352 
18.1 数据 持久 化 

18.2 模块 化 ……… 
18.2.1 数据 库 操作 模块 化 

18.2.2 文件 生成 模块 化 

18.2.3 ”邮件 发 送 模 块 化 … 

18.3 ”数据 分 析 的 实现 

18.4 项目 小 结 





.4 “Python 字符 串 内 建 函 数 - 
3 列 雪 方法 Reason 
A.6 字典 内 置 方法 … 
E 则 表达 式 模式 


4 








如 





进入 Python 3.5 的 精彩 世界 


本 章 主要 介绍 Python 的 起 源 、 应 用 场合 、 前 景 以 及 
Python 3 相对 于 Python 2 的 一 些 新 特性 。 另 外 ， 还 将 介绍 
Python 的 环境 构建 , 然后 以 一 个 简单 的 小 程序 hello word 开 
启 Python 的 编程 之 旅 。 
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1.1 Python 的 起 源 


Python 的 创始 人 为 Guido van Rossum〔 后 文 简称 Guido) 。1982 年 ，Guido 从 阿姆斯特丹 
大 学 获得 数学 和 计算 机 硕士 学 位 。 尽管 Guido 算得 上 是 一 位 数学 家 , 不 过 他 更 享受 计算 机 带 来 
的 乐趣 。 用 Guido 的 话说 ， 尽 管 他 拥有 数学 和 计算 机 双料 资质 ,不 过 他 趋向 于 做 计算 机 相关 的 
工作 ， 并 热衷 于 做 所 有 和 编程 相关 的 活 儿 。 

Guido 接触 并 使 用 过 Pascal、C、Fortran 等 语言 。 这 些 语 言 的 基本 设计 原则 是 让 机 器 运行 
得 更 快 。 在 20 世纪 80 年 代 ， 虽 然 IBM 和 苹果 已 经 掀起 了 个 人 电脑 浪潮 ， 但 是 那 时 候 个 人 电 
脑 的 配置 很 低 ， 比 如 早期 的 Macintosh 只 有 8MHz 的 CPU 主 频 和 128KB 的 RAM， 一 个 大 的 
数组 就 能 占 满 内 存 , 因此 所 有 编译 器 的 核心 都 是 做 优化 , 以 便 让 程序 能 够 运行 。 为 了 提高 效率 ， 
程序 员 不 得 不 像 计算 机 一 样 思考 ， 以 便 写 出 更 符合 机 器 口味 的 程序 ， 在 那个 时 代 , 程序 员 恨 不 
得 榨取 计算 机 每 一 寸 的 能 力 ， 有 人 甚至 认为 C 语言 的 指针 是 在 浪费 内 存 。 至 于 动态 类 型 、 内 
存 自 动 管理 、 面 向 对 象 等 就 不 要 想 了 ， 这 些 只 会 让 你 的 电脑 陷入 瘫痪 。 

这 种 编程 方式 让 Guido 感到 苦恼 。 虽然 Guido 知道 如 何 用 C 语言 写 出 一 个 功能 ， 但 整个 
编写 过 程 却 需要 耗费 大 量 时 间 。Guido 还 可 以 选择 Shell，Bourne Shell 作为 UNIX 系统 的 解释 
器 已 经 存在 很 久 了 。UNIX 的 管理 员 常 常用 Shell 写 一 些 简单 的 脚本 ， 以 进行 系统 维护 的 工作 ， 
比如 定期 备份 、 文 件 系 统管 理 等 。 在 C 语言 中 , 许多 上 百 行 的 程序 在 Shell 中 只 用 几 行 就 可 以 
完成 。 然 而 ，Shell 的 本 质 是 调用 命令 ， 它 不 是 一 个 真正 的 语言 ， 比 如 shell 没有 数值 型 的 数据 
类 型 ， 运 用 加 法 运算 都 很 复杂 。 总 之 ，Shell 不 能 全 面 调动 计算 机 的 功能 。 

Guido 希望 有 一 种 语言 能 够 像 C 语言 一 样 全面 调 用 计算 机 的 功能 接口 ， 又 可 以 像 Shell 一 
样 轻松 编程 。 ABC 语言 让 Guido 看 到 了 希望 ,该 语言 是 由 荷兰 的 数学 和 计算 机 研究 所 开发 的 ， 
Guido 曾经 在 该 研究 所 工作 ， 并 参与 了 ABC 语言 的 开发 。 与 当时 大 部 分 语言 不 同 ，ABC 语言 
是 以 教学 为 目的 ， 目 标 是 “让 用 户 感觉 更 好 ”， 和 希望 通过 ABC 语言 让 语言 变 得 容易 阅读 、 容 
易 使 用 、 容 易 记忆 、 容 易学 习 ， 并 以 此 激发 人 们 学 习 编程 的 兴趣 。 

ABC 语言 尽管 已 经 具备 了 良好 的 可 读 性 和 易 用 性 ， 不 过 始终 没有 流行 起 来 。 当 时 ，ABC 
语言 编译 器 需要 配置 比较 高 的 电脑 才能 运行 , 而 这 些 电脑 的 使 用 者 通常 精通 计算 机 , 他 们 考虑 
更 多 的 是 程序 的 效率 ， 而 不 是 学 习 难 度 。ABC 语言 不 能 直接 操作 文件 系统 ， 尽 管用 户 可 以 通 
过 文本 流 等 方式 导入 数据 ， 不 过 ABC 无 法 直接 读 写 文件 。 输 入 输出 的 困难 对 于 计算 机 语言 来 
说 是 致命 的 。 你 能 想象 一 款 打 不 开车 门 的 跑车 吗 ? 

1989 年 ， 为 了 打发 圣诞 节 假 期 ，Guido 开始 写 Python 语言 的 编译 器 。Python 这 个 名 字 来 
自 于 Guido 所 吏 爱 的 电视 剧 一 一 Monty Python”s Flying Circus。 他 希望 这 个 新 语言 Python 能 够 
符合 他 的 理想 : 创造 一 种 介 于 C 和 Shell 之 间 ， 功 能 全 面 、 易 学 易 用 、 可 拓展 的 语言 。Guido 
作为 一 个 语言 设计 爱好 者 ， 已 经 党 试 过 设计 语言 ， 这 次 不 过 是 一 种 纯粹 的 hacking 行为 。 

1991 年 , 第 一 个 Python 编译 器 诞生 。 该 编译 器 是 用 C 语言 实现 的 ,并且 能 够 调用 C 语言 
的 库 文件 。Python 诞生 时 便 具有 类 、 函 数 、 异 常 处 理 、 包 含 表 和 词典 在 内 的 核心 数据 类 型 以 
及 模块 为 基础 的 拓展 系统 。 
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Python 的 很 多 语法 来 自 于 C， 却 又 受 ABC 语言 的 强烈 影响 。 来 自 ABC 语言 的 一 些 规定 
至 今 还 富有 争议 (比如 强制 缩 进 ) ， 不 过 这 些 语 法 规定 让 Python 容易 理解 。 另 一 方面 ，Guido 
聪明 地 选择 让 Python 服从 一 些 惯例 ， 特 别 是 C 语言 的 惯例 ， 比 如 回归 等 号 赋值 。Guido 认为 

“常识 ”确定 的 东西 没有 必要 过 度 纠 结 。 

Python 从 一 开始 就 特别 在 意 可 拓展 性 。Python 可 以 在 多 个 层次 上 拓展 ， 在 高 层 可 以 直接 
引入 .py 文件 ， 在 底层 可 以 引用 C 语言 的 库 。 程 序 员 可 以 使 用 Python 快速 编写 的 .py 文件 作为 
拓展 模块 。 当 性 能 是 重点 考虑 的 因素 时 ， 程 序 员 可 以 深入 底层 写 C 程序 ， 将 编译 的 .so 文件 引 
入 Python 中 使 用 。Python 就 像 使 用 钢筋 建 房 一 样 ， 要 先 规 定好 大 的 框架 。 程 序 员 可 以 在 此 框 
架 下 相当 自由 地 拓展 或 更 改 。 

最 初 ，Python 完全 由 Guido 本 人 开发 ， 后 来 逐渐 受到 Guido 同事 的 欢迎 ， 他 们 迅速 反馈 
使 用 意见 ， 并 参与 Python 的 改进 。Guido 和 一 些 同事 构成 了 Python 的 核心 团队 ， 他 们 将 自己 
大 部 分 业余 时 间 用 于 hack Python，Python 逐渐 拓展 到 了 研究 所 外 。Python 将 许多 机 器 层面 的 
细节 隐藏 交 给 编译 器 处 理 ， 并 凸显 逻辑 层面 的 编程 思考 ， 程 序 员 使 用 Python 时 可 以 将 更 多 时 
间 用 于 程序 逻辑 的 思考 ， 而 不 是 具体 细节 的 实现 ， 这 一 特征 吸引 了 广大 程序 员 。Python 开始 
流行 起 来 了 。 





1.2 Python 的 应 用 场合 


现在 , 全 世界 有 600 多 种 编程 语言 , 但 流行 的 编程 语言 也 就 20 多 种 。 如 果 你 听 说 过 TIOBE 
排行 榜 ， 就 能 知道 编程 语言 的 大 致 流行 程度 。 图 1-1 是 2004 一 2014 年 最 常用 的 10 种 编程 语言 
的 变化 图 。 


TIOBE Programming Community Index 
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1-1 TIOBE 排行 榜 


从 2015 年 到 目前 为 止 ，Python 基本 处 于 第 5 位 ， 市 场 占有 率 次 于 Java、C、C++ 和 C#， 
这 个 现象 的 出 现 主要 是 从 2015 年 至 今 云 计算 和 大 数据 的 异常 火热 所 致 ， 特 别 是 OpenStack 的 
市 场 声望 越 来 越 高 ， 进 一 步 促 进 了 Python 的 市 场 需求 。 大 数据 方面 对 Python 人 才 的 需求 也 不 
断 加 大 ，Python 在 接 下 来 一 段 时 间 将 更 加 火热 。 


.3。 
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Python 在 云 计算 方面 的 用 途 很 大 ， 比 如 云 计算 中 IaaS (Infrastructure as a Service， 基 础 设 
施 即 服务 ) 层 的 很 多 软件 都 大 量 使 用 Python， 云 计算 的 其 他 服务 都 建立 在 IaaS 服务 的 基础 上 。 
下 面 这 些 使 用 比较 广泛 的 软件 就 大 量 使 用 Python 。 


(1) 企业 虚拟 化 平台 (CecOS)〉 中 的 一 些 计 算 和 自动 化 任务 。 
(2) 持续 交互 平台 (Spinnaker) 中 的 一 些 计算 和 自动 化 任务 。 
(3) 开源 IaaS 软件 (ZStack) 。 

(4) 开源 云 计 算 技 术 (OpenStack) 。 

(5) Amazon s3 命令 行 管理 工具 (s3cmd) 。 

(6) EC2 云 计算 管理 工具 (StarCluster) 。 


在 大 数据 领域 ，Python 的 使 用 也 越 来 越 广泛 。Python 在 数据 处 理 方面 有 如 下 优势 : 


(1) 异常 快捷 的 开发 速度 ， 代 码 非 常 少 。 

(2) 丰富 的 数据 处 理 包 ， 无 论 是 正则 ， 还 是 HTML 解析 、XML 解析 ， 用 起 来 都 非常 
方便 。 

(3) 内 部 类 型 使 用 成 本 很 低 ， 不 需要 许多 额外 操作 (java、C++ 用 一 个 Map 都 很 费劲 ) 。 

(4) 公司 中 大 量 数据 处 理工 作 不 需要 面 对 非 常 大 的 数据 。 

(5) 巨大 的 数据 不 是 语言 所 能 解决 的 ， 需 要 处 理 数据 的 框架 (如 Hadoop) 。Python 虽 
然 小 众 ， 但 是 有 处 理 大 数据 的 框架 。 一 些 框架 也 支持 Python 。 

(6) 编码 问题 处 理 起 来 非常 方便 。 

除了 在 云 计算 和 大 数据 领域 的 应 用 ， 许 多 大 型 网 站 
也 是 用 Python 开发 的 , 如 YouTube、Instagram 以 及 国内 
的 豆 辩 。 很 多 大 公司 包括 Google、Yahoo 以 及 NASA 都 
大 量 使 用 Python。 

我 们 熟知 的 豆 关 就 是 用 Python 搭建 的 ，Facebook 
也 是 扎 克 用 Python 开发 出 来 的 ， 后 来 的 Twitter 也 是 用 
Python 写 的 ， 实 际 上 Python 是 国外 很 多 大 公司 如 明确 
Google) 使 用 的 主要 语言 。 

龟 叔 给 Python 的 定位 如 图 1-2 所 示 , 为 “优雅 ”“ 明 
确 ”“ 简 单 ”。Python 程序 看 上 去 总 是 简单 易 懂 ， 初 学 图 1-2 Python 的 定位 
者 学 Python 不 但 容易 入 门 ， 而 且 将 来 深入 下 去 可 以 编写 非常 复杂 的 程序 。 

Python 的 哲学 就 是 简单 、 优 雅 、 明 确 ， 尽 量 写 容易 看 明白 的 代码 ， 尽 量 将 代码 写 得 更 少 。 

Python 是 一 个 简单 、 解 释 型 、 交 互 式 、 可 移植 、 面 向 对 象 的 超 高 级 语言 。 这 是 对 Python 
语言 最 简单 的 描述 。 

Python 有 一 个 交互 式 的 开发 环境 , Python 的 解释 运行 大 大 节省 了 每 次 编译 的 时 间 。Python 
语法 简单 ， 内 置 几 种 高 级 数据 结构 (如 字典 、 列 表 等 ) ， 使 得 使 用 起 来 特别 简单 。Python 具 
有 大 部 分 面向 对 象 语言 的 特征 , 可 完全 进行 面向 对 象 编程 。 Python 可 以 在 MS-DOS、Windows、 
Windows NT、Linux、Solaris、Amiga、BeOS、OS/2、VMS、QNX 等 多 种 操作 系统 上 运行 。 
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1.3 从 2.7 到 3.5，Python 的 新 特性 


目前 ，Python 有 两 个 版 本 ， 一 个 是 2.x 版 ， 一 个 是 3.x 版 ， 这 两 个 版 本 是 不 兼容 的 。3.x 
不 考虑 对 2.x 代码 的 向 后 兼容 。 虽 然 当前 大 部 分 公司 都 是 基于 2.7 版 本 进行 开发 的 ， 但 是 3.x 
版 会 越 来 越 普及 ， 所 以 本 书 将 以 最 新 的 Python 3.5 版 本 为 基础 进行 介绍 。 在 写本 书 时 ，Python 
的 最 新 版 本 是 3.5.2， 本 书 中 的 示例 和 讲解 内 容 都 是 基于 这 个 版 本 进行 的 。 建 议 读者 安装 3.5.0 
以 上 的 版 本 进行 学 习 ， 这 样 学 习 本 教程 中 的 内 容 才 会 更 加 容易 。 

在 3.x 中 ,一 些 语法 、 内 建 函 数 和 对 象 的 行为 有 所 调整 ,大 部 分 Python 库 都 同时 支持 Python 
2.7.x 和 3.x 版 本 ， 所 以 无 论 选择 哪个 版 本 都 可 以 。 为 了 在 使 用 Python 时 避免 某 些 版 本 中 常见 
的 陷阱 ,或 者 需要 移植 某 个 Python 项 目 时 ， 依 然 有 必要 了 解 一 下 Python 两 个 常见 版 本 之 间 的 
主要 区 别 。 

两 个 版 本 之 间 的 主要 区 别 如 下 : 

1. 使 用 _future “模块 

Python 3.x 引入 了 一 些 与 Python 2 不 兼容 的 关键 字 和 特性 。 在 Python 2 中 ,可 以 通过 内 置 
的 _ future_ 模块 导入 这 些 新 内 容 。 如 果 你 希望 在 Python 2 环境 下 写 的 代码 也 可 以 在 Python 3.x 
中 运行 ， 那 么 建议 使 用 _future “模块 。 

2. print 函数 

虽然 print 语法 是 Python 3 中 一 个 很 小 的 改动 ， 而 且 应 该 已 经 广为人知 ， 但 是 依然 值得 提 

-下 : Python 2 中 的 print 语句 被 Python 3 中 的 print0 函 数 取 代 ， 这 意味 着 在 Python 3 中 必须 
用 括号 将 需要 输出 的 对 象 括 起 来 。 在 Python 2 中 使 用 额外 的 括号 也 可 以 , 但 是 如 果 要 在 Python 
3 中 以 Python 2 的 形式 不 带 括号 调用 print 函数 ， 就 会 触发 SyntaxError( 语 法 错误 ) 。 

3. 整数 除法 

由 于 人 们 和 常常 会 忽视 Python 3 在 整数 除法 上 的 改动 〈 写 错 了 也 不 会 触发 SyntaxError) ， 
因此 在 移植 代码 或 在 Python 2 中 执行 Python 3 的 代码 时 需要 特别 注意 这 个 改动 。 

4. Unicode 

Python 2 有 基于 ASCII 的 str0) 类 型 ， 可 通过 单独 的 unicode() 函 数 转 成 unicode 类 型 ， 但 没 
有 byte 类 型 。 在 Python 3 中 有 了 Unicode (UTF-8) 字 符 串 和 两 个 字 节 类 (bytes 和 bytearrays ) 。 

5. xrange 


在 Python 2.x 中 ， 经 常会 用 xrange() 创 建 一 个 可 迭代 对 象 ， 通常 出 现在 “for 循环 ”或 “ 列 
表 / 集 合 /字典 推导 式 ” 中 。 在 Python 3 中 ，range() 的 实现 方式 与 xrange() 函 数 相同 ， 所 以 不 存 
在 专用 的 xrange() (在 Python 3 中 使 用 xrange0 会 触发 NameError) 。 
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6. 触发 异常 


Python 2 支持 新 旧 两 种 异常 触发 语法 ， 而 Python 3 只 支持 带 括号 的 语法 不然 会 触发 
SyntaxError) 。 


7. 处 理 异常 


Python 3 中 的 异常 处 理发 生 了 一 点 变化 。 在 Python 3 中 必须 使 用 as 关键 字 ，Python 2 中 


8. next() 函 数 和 .next() 方 法 


由 于 会 经 常用 到 next() .next0) 函数 〈 方 法 ) ， 因 此 要 提 到 另 一 个 语法 改动 〈 实 现 方面 
也 做 了 改动 ) : 在 Python 2 中 ， 函 数 形式 和 方法 形式 都 可 以 使 用 ;在 Python 3 中 ， 只 能 使 用 
next() 函 数 〔 试 图 调用 .next0 方 法 会 触发 AttributeError) 。 


9. for 循环 变量 与 全 局 命名 空间 泄漏 

在 Python 3.x 中 ，for 循环 中 的 变量 不 再 会 泄漏 到 全 局 命名 空间 中 了 。 

10. 比较 无 序 类 型 

Python 3 中 另 一 个 优秀 的 改动 是 ， 如 果 我 们 试图 比较 无 序 类 型 ， 就 会 触发 一 个 TypeError。 

11. 使 用 input() 解 析 输 入 内 容 

Python 3 改进 了 input() 函 数 , 这 样 该 函数 就 会 总 是 将 用 户 的 输入 存储 为 str 对 象 . 在 Python 
2 中 , 为 了 避免 读 取 非 字符 串 类 型 会 发 生 的 一 些 危 险 行为 , 不 得 不 使 用 raw_inputO0 代 替 input()。 

12. 返回 可 迭代 对 象 ， 而 不 是 列表 

某 些 函数 和 方法 在 Python 3 中 返回 的 是 可 迭代 对 象 ， 而 不 像 在 Python 2 中 返回 列表 。 对 
象 只 遍历 一 次 会 节省 很 多 内 存 ， 如 果 通 过 生成 器 多 次 迭代 这 些 对 象 , 效率 就 不 高 了 。 此 时 如 果 
需要 列表 对 象 ， 可 以 通过 Python 3 的 listO 函 数 简单 地 将 可 迭代 对 象 转 成 列表 。 














1.4 如 何 学习 Python 


学 习 Python 时 ， 建 议 找 一 些 学 习 搭档 一 起 学 习 和 讨论 ， 这 样 效果 会 更 好 。 若 能 尝试 将 一 
些 内 容 讲 给 他 人 听 ， 则 效果 更 佳 ， 在 讲述 的 过 程 中 你 会 思考 更 多 。 在 学 习 的 过 程 中 ， 对 于 遇 到 
的 例子 最 好 能 逐步 形成 自己 先 思 考 的 习惯 , 思考 后 再 看 看 给 出 的 示例 是 怎样 的 , 在 这 个 过 程 中 
或 许 能 找到 比 示例 更 好 的 处 理 方法 。 此 外 ， 练 习题 最 好 也 能 动手 完成 。 

在 写 代 码 时 ， 千 万 不 要 用 “复制 ”“ 粘 贴 ”把 代码 从 页 面 粘贴 到 你 的 电脑 上 。 写 程序 讲 
究 一 个 感觉 , 需要 一 个 字母 一 个 字母 地 把 代码 敲 进 去 。 在 敲 代码 的 过 程 中 , 初学 者 经 常会 敲 错 ， 
所 以 需要 仔细 检查 、 对 照 ， 这 样 才能 以 最 快 的 速度 掌握 如 何 写 程序 。 在 编写 代码 的 过 程 中 ， 宁 
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愿 写 得 慢 或 多 写 几 遍 ， 刚 开始 学 习 或 许 很 吃力 ， 但 随 着 慢 慢 积累 和 熟悉 ， 后 面 会 越 来 越 快 ， 越 
来 越 顺畅 。 若 习惯 拷贝 代码 ， 或 许 很 长 一 段 时 间 后 依然 只 会 拷贝 代码 ， 而 不 能 熟悉 相关 内 容 ， 
速度 也 提升 不 了 。 

语言 的 发 展 总 是 在 不 断 变化 ， 任 何 一 门 语言 要 让 大 家 持续 不 断 地 使 用 ， 都 需要 不 断 更 新 。 
语言 本 身 需 要 不 断 更 新 , 学 习 者 也 要 不 断 学 习 语言 本 身 的 新 东西 ， 这 样 才能 与 时 俱 进 、 跟 上 语 
言 的 发 展 。 

Python 作为 一 门 不 断 发 展 与 普及 的 语言 ， 还 在 不 断 更 新 中 。 如 果 要 了 解 有 关 最 新 发 布 的 
版 本 和 相关 工具 的 内 容 ，http:/www.python.org 就 是 一 个 聚宝 贫 。 加 入 一 些 Python 学 习 社区 或 
找到 一 些 有 共同 爱好 的 人 一 起 学 习 交 流 是 非常 好 的 学 习 Python 的 方式 。 正 所 谓 集思广益 ， 
起 思考 与 学 习 的 人 多 了 , 大 家 能 接触 和 学 到 的 知识 就 会 更 多 。 在 互联 网 时 代 , 更 应 该 发 挥 网 络 
互联 的 作用 ， 通 过 网 络 学 习 更 新 颖 、 更 与 时 俱 进 的 知识 。 

以 下 网 址 可 以 帮助 读者 更 好 地 学 习 Python: 

(1) http://www.liaoxuefeng.com/ 
(2) http://www.runoob.com/python3/python3-tutorial.html 


1.5 “Python 环境 构建 


工 欲 善 其 事 ， 必 先 利 其 器 。 在 开始 编程 前 ， 需 要 先 准备 好 相关 工具 。 下 面 简要 介绍 如 何 
下 载 和 安装 Python。 

Python 的 安装 软件 可 以 从 Python 官方 网 站 下 载 , 地址: https://www.python.org/downloads/。 
建议 下 载 软件 时 从 对 应 的 官方 网 站 下 载 ， 这 样 比较 权威 ， 而 且 更 加 安全 。 


1.5.1 在 Windows 系统 中 安装 Python 


在 Windows 中 安装 Python 可 以 参照 下 面 的 步骤 : 


G01 打开 Web 浏览 器 (如 百度 浏览 器 ，Google、 火 狐 等 )， 访 问 https://www.python.org/ 
downloads/， 进 入 网 页 ， 应 该 可 以 看 到 如 图 1-3 所 示 的 页 面 ， 单 击 图 中 红色 箭头 和 下 划 线 标注 的 地 
方 ， 进 入 对 应 的 软件 下 载 页 面 即 可 进行 软件 下 载 。 
































图 1-3 Python 官方 网 站 下 载 页 面 
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也 可 以 用 另 一 种 方式 下 载 软件 ， 如 图 1-4 所 示 。 直 接 在 浏览 器 的 搜索 框 中 输入 Python 下 载 ， 
可 找到 搜索 结果 ， 进 入 下 载 即 可 。 有 以 下 几 点 需要 注意 : 
(1) 查看 是 否 为 最 新 版 。 图 1-4 所 示 为 编写 本 书 时 的 Python 最 新 官方 版 。 
(2) 查看 是 电脑 版 还 是 Mac 版 。 图 1-4 中 显示 的 是 电脑 版 的 Python 软件 信息 。 
(3) 查看 版 本 号 。 图 1-4 中 Python 的 版 本 是 3.5.2。 
(4) 支持 的 环境 。 图 1-4 中 环境 信息 显示 支持 Windows 系列 的 环境 。 





00 
Bai 代 百度 python 下 载 





< 于 顶 ; WinXP/Win2003MVistaWin7/Win8 一 > 
外 使 用 百度 和 下载 丙 手 和 行 支 至 吉庆 下 载 * 
a aT 





图 1-4 Python 官方 网 站 下 载 页 面 

E02 下 载 安装 软件 后 ， 接 下 来 进行 软件 的 安装 。 

(1) 双击 下 载 好 的 软件 ， 或 者 选中 并 右 击 下 载 好 的 软件 ， 在 弹出 的 对 话 框 中 选择 “打开 ” 选 
项 ， 可 以 看 到 如 图 1-5 所 示 的 界面 。 底 部 的 第 一 个 复 选 框 默认 自动 勾 选 ， 保 持 勾 选 状态 即 可 ，Add 
Python 3.5 to PATH 复 选 框 默认 不 勾 选 ， 需 要 手动 勾 选 ， 可 以 将 Python 的 安装 路 径 添 加 到 环境 变量 
中 ， 勾 选 后 ， 后 面 可 省 去 该 操作 。 如 果 希 望 将 Python 安装 到 指定 路 径 下 ， 就 单 击 Customize 
installation。 如 果 单 击 Install Now， 系 统 就 会 直接 开始 安装 Python， 并 安装 到 默认 路 径 下 (此 处 建 
议 安装 到 自己 指定 的 目录 )。 


= Python 3.5.2 (64-bit) Setup BW Ee md (=. le 


Install Python 3.5.2 (64-bit) 


Select Install Now to install Python with default settings, or choose 
Customize to enable or disable features, 


加 Install Now 
CAUsers\yz\AppData\Local\Programs\Python\Python35 
Includes IDLE, pip and documentation 


Creates shortcuts and flle associations 





» Customize installation 
Choose location and features 


python ES 


for Install launcher for all users (recommended) 
windows 回 Add Python 3.5 to PATH -二 











1-5 安装 Python 


击 Customize installation 后 , 会 看 到 如 图 1-6 所 示 的 界面 。 此 处 没什么 需要 注意 的 , 直 
接 单 击 Next 即 可 。 
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= python 352 (54-bib Setup 时 To。 (= 


y Optional Features 
回 poamentation 


Instalk the Python documentation fle. 


加 pp 
Instals pip, which can cownload and installother Python packages. 
tdfik and IDLE 


Jnsialk tkinter and the IDLE deveiopment envronment 
Python tast suite 
Instals me standard library test suite. 
py launcher for al users (requires elevation) 
Insials the global py launcher to make it easer to start Python. 








python 
windows [CB |] — vet [cnc 


1-6 单 击 Next 按钮 
(3) 在 图 1-7 所 示 的 界面 中 ,第 一 个 红 箭 头 指向 的 是 系统 默认 的 Python 安装 路 径 ， 若 需要 更 
改 默认 安装 路 径 ， 则 可 单 击 第 二 个 箭头 所 指 的 Browse 按钮 。 
”paszetmsm nm i 
J Advanced Options 
TInstall for al users 
AssoGate files with Python (requires the py launcher) 
网 Create shortcuts for installed applications 
党 同 Add Python to environment variables 
DT Precompile standard fibrary 


口 Downioad debugging symbols 
Downlosd debug binaries (requires VS 2015 or aten 























Customize install location 











CAUsers\yr AppData\Loca\Programs\Python\Pytnon35 [Browse )) 

python 
for 

windows Ce Binstal | [Cancel | 

















图 1-7 更 改 安装 路 径 


(4) 如 图 1-8 所 示 ， 安装 路 径 没有 使 用 默认 路 径 ， 笔 者 已 将 安装 路 径 修 改 为 E:\python\ 
pythoninstall 。 


”Python 352 (54-bi Seiup 量 rr [I 


国光 Advanced Options 
Dinstall for all users 
Asscciate files with Python (requires the py launchen 
Create shortcuts for installed applications 
Add Python to environment variables 
口 precompile standard library 


器 Download cebugging symbols 
同 pownload debug bnares (requires VS 2015 or aten 





Customize install location 
Epythonpyimoninstal 
python 
for 
windows Ba Er 





i] 














1-8 查看 已 更 改 的 安装 路 径 
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(5) 更 改 安装 路 径 后 ， 单 击 Install 按钮 ， 得 到 如 图 1-9 所 示 的 安装 进行 中 界面 。 


2 Wpython 3.5.2 (64-bit) Setup = 3 





Setup Progress 


Instaling: 
Python 3.5.2 Core Interpreter (54-bi 
Ee | 


puthon 
for 
windows 
图 1-9 安装 进行 中 


(6) 待 安装 完成 会 得 到 如 图 1-10 所 示 的 安装 成 功 界面 。 单 击 Close 按钮 , 安装 工作 就 完成 了 。 
Python 的 安装 是 不 是 很 简单 ? 


2 python 3.5.2 (64-bit) Setup = 于 

















RM 
‘Setup was successful 


Specal thanks to Mark Hammond, without whose years of freely 
shared Windows expertise Python for Windows would stil be Python 


for DOS, 
New to Python? Start with the online tutonal and documentation 


python 
windows 
图 1-10 ”安装 完成 
C03 软件 安装 成 功 后 ， 查 看 你 安装 的 软件 是 否 能 成 功 运行 (此 处 以 Windows 7 系统 为 例 ， 
其 他 相关 系统 可 以 查找 对 应 信息 进行 查看 ) 。 


单 击 电脑 的 “开始 ”按钮 , 可 以 看 到 如 图 1-11 所 示 的 输入 框 , 在 输入 框 中 输入 cmd 三 个 字符 ， 
如 图 1-12 所 示 。 




















[emd x| En 








图 1-11 输入 框 图 1-12 输入 cmd 
输入 cmd 后 按 Enter 键 ， 得 到 如 图 1-13 所 示 的 cmd 命令 界面 。 
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y 
FE 
ft Windovs [版 本 6-1-3661 本 
有 《c》2889 Microsoft Corporation。 保 留 所 有 权利 











1-13 ”cmd 命令 界面 


在 cmd 命令 界面 输入 python 字符 ， 输 入 完成 后 按 Enter 键 ， 得 到 如 图 1-14 所 示 的 界面 。 
其 中 ， 红 色 椭 圆圈 所 示 为 输入 的 字符 ， 下 面 打印 了 一 些 安装 信息 ， 红 色 下 划 线 标注 的 为 安装 
Python 的 版 本 ， 当 前 安装 的 是 3.5.2 版 本 。 输 入 Python 命令 ， 同 时 进入 Python 控制 台 ， 可 以 
在 这 里 输入 命令 并 得 到 相应 结果 ， 此 处 不 做 进一步 讲解 ， 在 下 一 章 会 进行 具体 介绍 。 

[Wwindowssystem3nemd exe Python = ee | 
t Windows [ 腺 本 6.1.7681] 


所 有 《ce》2989 Microsoft Corporation。 保 留 所 有 权利 











ython | 
5.2:4def2a2981a5, Jun 25 2816, 22:18:55> [MSC v-1999 64 bit CAM| 


yright", “credits” or “license" for more information- 














图 1-14 Python 命令 


此 处 输入 python 命令 看 到 的 信息 比较 多 ， 有 不 少 其 他 信息 ， 若 只 想 查 看 版 本 信息 ， 可 输 
入 命令 -version, 如 图 1-15 所 示 。 该 命令 的 使 用 方式 为 : python -version。 从 输出 结果 可 以 看 到 ， 
信息 非常 简单 明了 , 结果 为 Python ， 版 本 是 3.5.2， 和 图 1-14 的 结果 是 一 样 的 , 但 没有 图 1-14 
中 的 其 他 信息 。 注 意 version 前 面 有 两 个 “-” 符 。 从 图 1-15 可 以 看 到 ， 退 出 Python 控制 台 的 
命令 为 exit()。 

到 此 为 止 ，Python 环境 总 算是 搭建 完成 了 。 如 果 在 图 1-5 中 没有 勾 选 Add Python 3.5 to 
PATH 会 怎么 样 呢 ? 
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lsh 


r 
画 CN\Windows\vsystem3zvcmdexe 本 JW 


TITTTTWTEERECTTD 
折 有 《ec》2889 Microsoft Corporation。 保 留 所 有 权利 


] 

lc: Wsers\lyz>python 

2 (v3.5.2:4def2a2981a5, Jun 25 2816, 22:18:55> [MSC v.1908 64 bit CAM 
2 


n3: 


"copyright"。 “credits" or “license” for more infornation. 


jc: Wsers\ly2>p9thon 一 version 
Python 3.5-2 


lc: users\lyz> 

















1-15 ”Python 版 本 查看 
在 安装 时 没有 勾 选 Add Python 3.5 to PATH， 则 在 如 图 1-14 和 1-15 操作 时 分 别 会 得 到 图 


1-16 所 示 的 结果 。 
[ 画 CWindows\system3D emd exe 


Microsoft Windows [ 腺 本 6.1.?681] 
所 有 《cec》 2889 Microsoft Corporation。 保 留 所 有 权利 。 








ya>pyhton 3 
部 或 外 部 命令 ， 也 不 是 可 运行 的 程序 














图 1-16 未 勾 选 Add Python 3.5 to PATH 显示 结果 1 


Windows 会 根据 Path 环境 变量 设 定 的 路 径 查 找 python.exe， 如 果 没 找到 就 会 报错 。 因 此 如 
果 在 安装 时 漏 掉 了 勾 选 Add Python 3.5 to PATH， 就 要 手动 把 python.exe 所 在 的 路 径 添加 到 


Path 中 。 
如 果 不 喜欢 自己 动手 修改 环境 变量 ， 可 以 把 Python 安装 程序 重新 运行 一 遍 ， 务 必 记 得 勾 


选 Add Python 3.5 to PATH。 
如 果 想 尝试 添加 环境 变量 ， 可 以 执行 以 下 操作 。 
选择 “开始 ”一 “计算 机 ”找到 计算 机 就 可 以 ) ， 选 中 并 右 击 计算 机 ， 在 弹出 的 菜单 
中 单 击 “属性 ”， 弹 出 如 图 1-17 所 示 的 界面 。 
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OO le , we , sis ,Fn ”| sasss P| 
文件 (有 坊 坟 (查看 V) 工具 Mm 帮助 (H) 
©- 
Ee 查看 有 关 计算 机 的 基本 信息 
国 设 各 管理 器 Windows 版 本 
加 云 R 重 Windows 7 旋 员 版 
se 版 权 所 有 日 2009 Microsoft Corporation， 保 所 有 权利 . 
国语 加 至 法 设 十 人 Service Pack 1 
A 
9: 加 wd as 
处 理 话 : Intel(R) Core(TM) i5-4200U CPU @ 1.60GHz 1.60 GHz 
安装 内 存 (RAM): 16.0 GB 
Rm 位 溉 作 系统 
和 和 0 角 搞 : 没有 可 用 于 北 畦 示 茵 的 和 开胃 演 玉 入 
rs 莽 机 全 称 、 域 和 工作 给 设 轩 
地 作 中 心 NE 
Windows Update HNE: bePc 办 更 xis 重 


计算 机 全 全: bz-PC 


人 性 能 信息 和 工具 





图 1-17 计算 机 属性 


单 击 “ 高 级 系统 设置 ”〈 图 中 箭头 所 指 ) ， 弹 出 如 图 1-18 所 示 的 “系统 属性 ”界面 。 
该 界面 默认 显示 “高 级 ”菜单 界面 ， 如 果 进 入 后 显示 的 不 是 “高 级 ”菜单 界面 ， 就 手动 
选择 “高 级 ”菜单 。 在 该 界面 的 右 下 角 单 击 “ 环 境 变量 ”按钮 ， 得 到 如 图 1-19 所 示 的 界面 。 




























































































一 环 吉 交 有 省 汪汪 生生 汪汪 
= = 
计算 机 名 | 硬件 系统 保护 [运程 | ee 
要 进行 大 多 数 更 改 ， 您 必须 作为 管理 员 登 录 。 
性 能 变量 值 加 
视 沉 效 果 ， 处 理 器 计划 ， 内 存 使 用 ， 以 及 虚拟 内 存 OT E 
E:\python\pythoninstall\Seripts... | 
[ET Fe WUSERPROFILEX\AppData\Locsl \Tenp 
| TP WISRRPRNPTIRXNAnnNataM.ncal YTemn ~ 
用 户 配置 文 件 
与 您 录 有 关 的 上 而 设置 四.…] MD. MSD 
训 本 
启 二 和 地 障 恢复 
系统 启动 、 系 统 失败 和 调试 信息 
设置 中 CON: EXE; - 可 :VBE; 
| LPRnPRSSnR_AR ANNRA Bd 
环境 朗 量 0 [ 守 时 D... ] [ 编 强 中... ] [ 出 攻 由 
i 
二 用 | 
0 a 
1-18 系统 属性 图 1-19 环境 变量 


双击 图 1-19 中 箭头 所 指 的 Path， 弹 出 “编辑 用 户 变量 ”界面 ， 在 界面 的 “变量 值 ”输入 
框 中 加 入 Python 的 安装 路 径 〈 如 E:\python\pythoninstall) ， 如 图 1-20 所 示 。 
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纺 各 用 广 变 


变量 
变量 名 ws PATH | 


| 确定 ]| 取消 














变星 值 

CLASSPATH :MTAVA_HOME%N1ib: XTAVA_HOMENNL 
ComSpec C:\Windows\systen32\cnd. exe 

FP WST 5... WM 

TAVA_ HNMR RNiavad idk\iqdkl R 用 


新 建 编辑 0 | | 暗 除 0 














图 1-20 编辑 用 户 变 量 














注意 ， 变 量 值 中 的 内 容 可 以 英文 分 号 (;) 开始 ， 前 面 有 一 个 分 号 ， 并 以 \ 结 尾 ， 
如 ;E:python\pythoninstal\。 单 击 “ 确 定 ” 按 钮 可 回 到 图 1-19， 在 图 1-19 中 单 击 “ 确 定 ”按钮 ， 
可 回 到 图 1-18， 在 图 1-18 中 单 击 “ 确 定 ” 按 钮 ， 环 境 变量 就 添加 成 功 了 。 接 下 来 就 可 以 如 网 
1-11 所 示 进 行 操作 。 

至 此 ， 在 Windows 上 安装 Python 就 结束 了 。 


1.5.2 在 Linux 和 UNIX 系统 中 安装 Python 





如 果 你 正在 使 用 Linux， 而 且 有 Linux 系统 管理 经 验 ， 自 行 安装 Python 3 就 没有 问题 ， 否 
则 请 换 回 Windows 系统 。 





在 绝 大 多 数 Linux 和 UNIX 系统 中 ，Python 解释 器 已 经 存在 了 ， 但 是 预 装 的 Python 版 本 
- 般 都 比较 低 ， 很 多 Python 的 新 特性 都 没有 ， 必 须 重 新 安装 新 版 本 。 在 图 1-21 中 可 以 看 到 ， 
linux 下 预 装 的 Python 版 本 是 2.7.5。 这 里 笔者 准备 安装 版 本 3.5.1。 











图 1-21 Linux 中 预 装 的 Python 


下 面 以 在 CentOS 7 下 安装 Python 3.5 为 例 进行 介绍 ， 安 装 步骤 如 下 : 
人 ET) 安装 Python 3.5 可 能 使 用 的 依赖 命令 如 下 : 




















yum install openssl-devel bzip2-devel expat-devel gdbm-devel readline-devel sqlite-devel 


执行 结果 如 图 1-22 所 示 。 
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sady installe 





图 1-22 ”安装 Python 依赖 


02 到 Python 官方 网 站 找到 下 载 路 径 ， 用 wget 下 载 ， 














wget https://www.python.org/ftp/python/3.5.1/Python-3.5.1.tgz 
执行 结果 如 图 1-23 所 示 ， 


2016-04 


org (www.python 1 
ython,org (www.python,org)1193.2 
awaiting re 8 OK 


tream] 


图 1-23 下 载 Python 





tar -ZXVf Python-3.5.1.tgz 


执行 结果 如 图 1-24 所 示 。 


yt 


/ptistLib_generate_testdata.p 
Makefile.in 
Extras .ins l.py 
Mac/README 
/PythonLauncher 


命令 如 下 








ythonLauncher/MyDocument .m 


图 1-24 解压 tgz 包 
04 把 Python 移 到 /usr/local 下 ， 命令 如 下 


mv Python-3.5.1 /usr/local 


删除 旧版 本 的 Python 依赖 ,命令 如 下 


ll /usr/bin | grep python 
rm -rf /usr/bin/python 


执行 结果 如 











1-25 所 示 





python 
4 abrt-action- 
1 pytho > /usr 


ython-3.5.1 





图 1-25 ”删除 旧版 Python 依赖 
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人 EL05 进入 Python 目录 , 命令 如 下 
cd /usr/local/Python-3.5.1/ 


执行 当前 目录 下 的 配置 ， 命 4 








configure 
执行 结果 如 图 1-26 所 示 。 


Z941c7bwcoZ Python- 
build syste 














for --with-universal 
g MACHDEP linux 
for --wit| 
r gcc gcc 
whether the C compiler works 
f pil fault output fil 


图 1-26 配置 


Wunreachable-c DNDEBL 
DPy_BUILD_CORE -o Pr 
eachable-c DNDEBL 


DPy_BUILD_CORE -0 Pars 


ab DNDEBL 
bpy_BUILD 


DPy_BUILD 
hable-c 
DPy_BUILD 
Wunreachable-c 
DPy_BUILD 
unreachable-c 
DPy_BUILD 
DNDEBL 


DPy_BUILD_CORE -0 pars 


de -DNDEBU 
ation-a sta C DPy ORE -0 par 





JI07 编译 ， 安 装 ,命令 如 下 
make install 


执行 结果 如 图 1-28 所 示 。 














941c7bwcoz Pyth 3.5.1]# make install 
te = 
bin/python3. Sm; 


pythonw /usr/local/bin/pyt 


h /usr/Locat/biny 


图 1-28 安装 





Wstrict-pr 
ograms/python 


Wstrict-pr 
Wstrict 
tset 
Wstrict-pr 
metagral 


f-pr 
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GI08 出 除 卓 的 软 链接 ， 创 建新 软 链接 到 最 新 的 Python， 命 令 如 下 : 


rm -rf /usr/bin/python 
ln -s /usr/local/bin/python3.5 /usr/bin/python 


查看 安装 版 本 ， 命 令 如 下 


python -V 





执行 结果 如 图 1-29 所 示 。 














图 1-29 查看 版 本 

至 此 ， 在 Linux 下 安装 3.5.1 版 本 的 Python 就 完成 了 。 若 安装 过 程 中 有 任何 问题 或 异常 ， 
则 可 以 自行 查找 相关 资料 进行 解决 。 
1.5.3 在 Mac OS 系统 中 安装 Python 

如 果 你 正在 使 用 Mac， 系 统 是 OS X 10.8~10.10， 系 统 自 带 的 Python 版 本 是 2.7。 如 果 要 
安装 Python 3.5， 有 以 下 两 种 方法 。 

方法 一 : 从 Python 官方 网 站 下 载 Python 3.5 的 安装 程序 (网 速 慢 的 同学 请 移 步 国内 镜像 )， 
双击 运行 并 安装 。 

方法 二 : 如 果 已 安装 Homebrew， 就 可 以 直接 通过 命令 brew install python 3 安装 。 

在 python.org 下 载 Mac OS X 64-bit/32-bit installer。 运 行 安装 包 , 删 除 Mac 自 带 的 Python 2.7， 
命令 如 下 : 

sudo rm -R /System/Library/Frameworks/Python.framework/Versions/2.7 

把 安装 好 的 Python 目录 移 到 原本 系统 的 目录 位 置 ， 命 令 如 下 : 


sudo mv /Library/Frameworks/Python.framework/Versions/3.5 
/System/Library/Frameworks/Python.framework/Versions 


将 文件 所 属 的 Group 修改 为 wheel， 命 令 如 下 : 

sudo chown -R root:wheel /System/Library/Frameworks/ 

Python.framework/Versions/3.5 

更 新 一 下 Current 的 Link， 原 来 是 指向 系统 自 带 的 Python 2.7， 重 新 链接 一 下 , 命令 如 下 : 


sudo rm /System/Library/Frameworks/Python.framework/Versions/Current 
sudo ln -s /System/Library/Frameworks/Python.framework/Versions/3.5 
/System/Library/Frameworks/Python.framework/Versions/Current 
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重新 链接 可 执行 文件 
(1) 先 把 系统 原来 的 执行 文件 删 掉 ， 命 令 如 下 : 


sudo rm /usr/bin/pydocsudo rm /usr/bin/pythonsudo rm /usr/bin/pythonwsudo 
rm /usr/bin/python-config 


(2) 建立 链接 ， 命 令 如 下 : 


sudo ln -s /System/Library/Frameworks/Python.framework/Versions/3.5/bin/ 
pydoc3.5 /usrbin/pydoc 

sudo ln -s /System/Library/Frameworks/Python.framework/Versions/3.5/bin/ 
python3.5 /usr/bin/python 

sudo ln -s /System/Library/Frameworks/Python.framework/Versions/3.5/bin/ 
pythonw3.5 /usr/bin/pythonw 

sudo ln -s /System/Library/Frameworks/Python.framework/Versions/3.5 
/bin/python3.5m-config /usr/bin/python-config 


至 此 ， 在 Mac 下 安装 3.5 版 本 的 Python 就 完成 了 。 若 安装 过 程 中 有 任何 问题 或 异常 ， 可 
以 自行 查找 相关 资料 进行 解决 。 


1.5.4 ”其 他 版 本 


除了 官方 版 本 的 Python 外 ， 还 有 多 个 版 本 可 供 选择 ， 最 有 名 的 为 ActivePython， 使 用 于 
Linux、Windows、Mac OSX 以 及 多 个 UNIX 变种 。 ActivePython 是 由 ActiveState 发 布 的 Python 
版 本 。 这 个 版 本 的 内 核 与 使 用 于 Windows 版 本 的 标准 Python 发 布 版 本 相同 ， 而 ActivePython 
包含 许多 额外 独立 的 可 用 工具 。 如 果 用 的 是 Windows， 那 么 ActivePython 值得 尝试 一 下 。 

Stackless Python 是 Python 的 重新 实现 版 本 ， 基 于 原始 的 代码 ， 也 包含 一 些 重要 的 内 部 改 
动 。 对 于 入 门 用 户 来 说 ， 两 者 并 没有 多 大 区 别 ， 标 准 的 发 布 版 反而 更 好 用 。Stackless Python 
最 大 的 优点 是 允许 深层 次 递归 ， 并 且 多 线程 执行 更 加 高 效 。 不 过 这 些 都 是 高 级 特性 ， 一 般 用 户 
并 不 需要 。 

Jython 和 IronPython 与 以 上 版 本 大 有 不 同 它们 都 是 其 他 语言 实现 的 Python。jJython 
利用 Java 实现 ,运行 在 Java 虚拟 机 中 ; IronPython 利用 C# 实 现 , 运 行 于 公共 语言 运行 时 的 .NET 
和 Mono 中 。 





1.6 从 hello word 开始 


经 过 前 面 几 个 小 节 的 介绍 ， 现 在 你 是 否 有 一 种 跃跃欲试 的 感觉 。 下 面 将 带 你 进入 Python 
的 实战 。 

英文 的 “你 好 ， 世 界 ” 怎 么 说 呢 ? “Hello,world”。 怎 么 在 Python 中 将 这 个 效果 展现 出 
来 呢 ? 
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安装 好 Python 后 , 在 “开始 ”菜单 栏 中 会 自动 添加 一 个 bPython 35 癌 
Python 3.5 文件 夹 ， 单 击 该 文件 夹 会 出 现 如 图 1-30 所 示 的 子 We OE (yo Ss 6 
本 python 3.5 (64-bit) 
目录 。 图 Python 3.5 Manuals (64-bit) 


可 以 看 到 ，Python 目录 下 有 4 个 子 目录 ， 从 上 到 下 依次 风 python 3.5 Module Docs (64-bid 
是 IDLE、Python 3.5、Python 3.5 Manuals 和 Python3.5 Module 
Docs。IDLE 是 Python 集成 开发 环境 ， 也 称 交互 模式 ， 具 备 
基本 的 IDE 功能 ， 是 非 商 业 Python 开发 的 不 错 选 择 ，Python 3.5 是 Python 的 命令 控制 台 ， 窗 
口 跟 Window 下 的 命令 窗口 一 样 ， 不 过 只 能 执行 Python 命令 ; 第 3 个 是 帮助 文档 ， 单 击 后 会 
弹出 帮助 文档 ， 不 过 是 全 英文 的 ，Python 3.5 Module Docs 是 模块 文档 ， 单 击 后 会 跳 转 到 一 个 
网 址 ， 可 以 查看 目前 集成 的 模块 。 本 书 若 无 特 别 指 出 ， 示 例 都 是 在 IDLE 中 执行 的 。 

下 面 正式 进入 hello world 的 世界 。 打 开交 互 模式 ， 如 图 1-31 所 示 。 





1-30 Python 菜单 


EEC 三 -一 








图 1-31 Python 交互 模式 


>>> 表 示 在 Python 交互 式 环境 下 。 在 Python 交互 式 环境 下 只 能 输入 Python 代码 并 立刻 执行 。 
在 交互 式 环境 下 输入 print (Hello,world)， 按 回 车 键 后 ， 可 以 看 到 输出 了 Hello,world!， 如 
图 1-32 所 示 。 此 处 print 后 面 带 了 括号 ， 表 示 print 是 一 个 函数 (函数 的 概念 将 会 在 后 面 的 章 
车 单独 进行 讲解 ), 单 引 号 里 面 的 叫 字符 串 。 如 果 要 让 Python 打印 指定 的 文字 , 就 可 以 用 print() 
函数 。 把 要 打印 的 文字 用 单 引 号 或 双 引 号 括 起 来 ， 但 单 引号 和 双 引 号 不 能 混用 。 
[8 Python 35.2 Shell 


Ele Edit Shell Debug Qptions Window Help 


Python 3.5.2 (v3.5.2:4def2a2901a5, Jun 25 2016, 22:18:55) [MSC v.1900 64 bit (CAN 过 
D64)] on win32 

Type “copyright’, “credits” or “license()” for nore infornation. 

> (Hello, worldl’ ) 人 











22> print 人 
[um worldl 


图 1-32 ”Python 输入 输出 
17 调 试 


在 电脑 前 阅读 本 书 是 一 个 好 主意 ， 你 可 以 边 看 书 边 试验 书 中 的 示例 。 每 当 学 习 新 的 语言 
特性 时 ， 应当 尝试 犯错 误 。 因 为 错误 会 帮助 你 记 住 所 学 的 内 容 ， 也 会 帮助 你 在 日 后 的 应 用 中 少 
走 弯 路 。 就 像 俗话 说 的 : 吃 一 租 长 一 智 。 

我 们 以 1.7 节 的 “Hello,world! 为 例 , 如 果 将 print ('Hello,world!") 修 改 为 print ('Hello,world!)， 
去 掉 后 面 的 单 引 号 ， 在 交互 模式 下 测试 一 下 。 

输入 以 下 语句 : 


print ('Hello,world!) 
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可 以 看 到 ， 屏 幕 输出 结果 如 图 1-33 所 示 。 


1 人 Python 3.5.2 Shell 
Fle Edit Shell Debug Options Window Help 
了 Python 3.5.2 (v3.5.2:4def2a2901a5, Jun 25 2016, 22:18:55) [MSC v.1900 64 bit (AM 


D64)] on win32 
Type “copyright”, “credits” or “license()” for more infornation. 
上 


Hello, world! 
>>> print (Hello vorldl 人 0 


SyntaxError: EOL While scarming string literal 
































图 1-33 ”Python 错误 尝试 
输出 了 一 行 红色 的 信息 ， 内 容 如 下 : 


SyntaxError: EOL while scanning string literal 


这 个 是 什么 意思 呢 ? 如 果 不 明 白 ， 可 以 先 借助 网 络 或 其 他 工具 查找 ， 后 面 碰 多 了 一 看 就 
知道 是 什么 意思 了 。 这 在 本 书 是 第 一 次 碰 到 ， 解 释 一 下 ， 意思 为 : 语法 错误 ， 当 扫描 字符 串 时 
发 生 错 误 。 

通过 这 个 错误 ， 看 到 相关 的 错误 信息 时 应 当 能 很 快 知道 问题 的 原因 。 

若 把 第 一 个 单 引 号 去 除 又 会 发 生 什么 情况 呢 ， 是 否 会 和 上 面 报 同样 的 错误 ? 下 面 动手 实 
践 一 下 。 

输入 以 下 语句 : 

print (Hello,world!') 

运行 结果 如 图 1-34 所 示 。 


| 
Ele Edit Shell Debug Qptions Window Help 
Python 3. 5. 2 (v3.5.2:4def2a2901a5, Jun 25 2016, 22:18:55) DISC v.1900 64 bit (AN a 
D64)] ,on win32 





>>> print (Hello, world!) 


SyntaxError: EOL while scarming string literal 
>》>》print (Hello,world )q—— 











SyntaxError: invalid syntax 








图 1.34 ”Python 错误 尝试 


可 以 看 到 ， 错 误 信息 和 图 1-34 报 的 不 一 样 。 大 家 可 以 通过 犯错 发 现 更 多 有 趣 的 现象 ， 此 
处 就 不 再 列举 更 多 的 例子 了 。 


1.8 问题 解答 


本 章 介绍 了 Python 的 发 展 历程 、Python 的 安装 和 一 个 简单 示例 的 相关 操作 ， 虽 然 是 入 门 
知识 ,但 是 在 操作 过 程 中 也 会 遇 到 问题 .下 面 结合 笔者 的 经 验 和 其 他 人 的 分 享 做 一 些 问题 解答 。 
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(1) 要 学 习 本 书 的 内 容 ， 一 定 要 安装 最 新 版 本 的 Python 吗 ? 
答 : 建议 安装 最 新 版 本 。 毕 竞技 术 在 不 断 更 新 ， 对 于 新 手 来 说 ， 学 习 最 新 版 本 一 般 是 最 
好 的 切入 方式 ， 若 不 想 安装 最 新 版 本 ， 建 议 安装 3 以 上 的 版 本 。 


(2) 企业 大 部 分 都 用 2.7 版 本 ， 我 学 习 3 以 上 版 本 ， 是 不 是 到 了 企业 还 得 学 习 2.7? 

答 : 大 部 分 企业 不 会 如 此 。 既 然 Python 已 经 发 展 到 了 3.5 版 本 ， 并 且 3 以 上 的 版 本 比 2 
版 本 有 了 不 少 改 进 和 优化 , 企业 肯定 也 要 与 时 俱 进 , 有 些 企业 可 能 由 于 历史 原因 需要 维护 老 项 
目 ， 需 要 用 到 Python 2 版 本 的 知识 ， 更 多 企业 还 是 会 用 Python 3 版 本 以 上 开发 的 。 


(3) 下 载 后 出 现 modify setup 和 setup failed， 重 新 下 载 也 是 这 样 ， 该 怎么 办 呢 ? 
答 : 该 问题 出 现 的 原因 一 般 是 操作 系统 版 本 太 低 。 建 议 大 家 学 习 时 安装 主流 的 系统 ， 这 
样 大 部 分 软件 安装 时 就 不 会 存在 操作 系统 版 本 低 或 操作 系统 不 兼容 等 问题 。 


1.9 温 故 知 新 ， 学 以 致 用 


(1) 回顾 一 下 Python 的 发 展 历程 ， 即 起 源 、 应 用 场景 。 

(2) 在 本 地 安装 Python 最 新 版 本 ， 安 装 好 后 卸载 ， 外 载 后 再 安装 ， 尽 量 关注 一 下 各 个 步 
又 的 细节 。 

(3) 尝试 在 不 同 操作 系统 上 安装 Python。 

(4) 在 “Hell world!” 示 例 中 ， 尝 试 将 print 函数 拼写 错误 ， 查 看 输出 结果 。 

(5) 不 要 用 电脑 测试 ， 自 己 想 想 print (1+2) 的 输出 结果 。 





1 


外 





第 2 开启 Python 之 旅 


本 章 主 要 介绍 Python 的 基础 知识 ， 为 后 续 章 节 学 习 相 
关内 容 做 铺垫 。 





A 
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2.1 认识 程序 


旅行 前 ， 我 们 要 先 熟悉 地 名 ， 知 道 去 哪里 旅行 ， 将 会 经 过 哪里 。 学 习 编程 语言 也 一 样 ， 
在 学 习 之 前 要 先 了 解 程序 、 调 试 、 语 法 错误 、 运 行 错 误 、 语 义 错误 等 知识 。 


2.1.1 程序 


我 们 都 知道 ， 出 门 旅行 肯定 要 选择 交通 工具 ， 现 在 常用 的 交通 工具 有 飞机 、 火 车 、 轮 船 、 
汽车 等 ， 我 们 会 根据 自己 的 喜好 和 一 些 其 他 因素 选择 对 应 的 交通 工具 。 

编程 语言 也 一 样 ， 我 们 选择 一 门 编 程 语言 就 相当 于 选择 一 种 交通 工具 ， 那 么 ， 编 程 语言 
的 “交通 ”工具 是 什么 呢 ? 是 程序 。 

程序 是 指 根据 语言 提供 的 指令 按照 一 定 罗 辑 顺序 对 获得 的 数据 进行 运算 ， 并 最 终 返 回 给 
我 们 的 指令 和 数据 的 组 合 。 在 这 里 ， 运 算 的 含义 是 广泛 的 ， 既 包括 数学 计算 之 类 的 操作 〈 如 加 
减 乘除 ) ， 又 包括 寻找 和 替换 字符 串 之 类 的 操作 。 数 据 依据 不 同 的 需要 组 成 不 同 的 形式 ， 处 理 
后 的 数据 也 可 能 以 另 一 种 方式 体现 。 

程序 是 用 语言 写成 的 。 语 言 分 高 级 语言 和 低级 语言 。 

低级 语言 有 时 叫 机 器 语言 或 汇编 语言 。 计 算 机 真正 “认识 ”并 能 够 执行 的 代码 ， 在 我 们 
看 来 是 一 串 0 和 !1 组 成 的 二 进 制 数 字 , 这 些 数字 代表 指令 和 数据 。 早期 的 计算 机 科学 家 就 是 用 
这 些 枯燥 乏味 的 数字 编程 。 低 级 语言 的 出 现 是 计算 机 程序 语言 的 一 大 进步 , 它 用 英文 单词 或 单 
词 的 缩写 代表 计算 机 执行 的 指令 , 使 编程 的 效率 和 程序 的 可 读 性 都 有 了 很 大 提高 , 但 它 仍然 和 
机 器 硬件 关联 紧密 , 不 符合 人 类 的 语言 和 思维 习惯 , 而 且 要 想 把 用 低级 语言 写 的 程序 移植 到 其 
他 平台 ， 就 必须 重 写 。 

高 级 语言 的 出 现 是 程序 语言 发 展 的 必然 结果 ， 也 是 计算 机 语言 向 人 类 的 自然 语言 和 思维 
方式 逐步 靠近 和 模拟 的 结果 。 由 于 高 级 语言 是 对 人 类 逻辑 思维 的 描述 , 用 高 级 语言 写 程序 会 感 
到 比较 自然 ， 读 起 来 也 比较 容易 ， 因 此 现在 大 部 分 程序 都 是 用 高 级 语言 写 的 。 

高 级 语言 设计 的 目的 是 让 程序 按照 人 类 的 思维 和 语言 习惯 书写 ， 是 面向 人 的 ， 而 不 是 面 
向 机 器 。 我 们 用 着 方便 ， 机 器 却 无 法 读 懂 ， 更 谈 不 上 运行 。 所 以 ,用 高 级 语言 写 的 程序 必须 经 
过 “翻译 ”程序 的 处 理 ， 将 其 转换 成 机 器 可 执行 的 代码 ， 才 能 运行 在 计算 机 上 。 如 果 想 把 高 级 
语言 写 的 程序 移植 到 其 他 的 平台 ， 只 需 在 它 的 基础 上 做 少量 更 改 就 可 以 了 。 

高 级 语言 翻译 成 机 器 代码 有 两 种 方法 ， 即 解释 和 编译 。 

解释 型 语言 是 边 读 源 程序 边 执行 。 高 级 语言 就 是 源 代 码 。 解 释 器 每 次 会 读 入 一 段 源 代码 ， 
并 执行 它 ， 接 着 再 读 入 并 执行 ， 如 此 重复 ， 直 到 结束 ， 图 2-1 显示 了 解释 器 的 结构 。 这 个 有 点 
类 似 在 乡村 里 搭乘 公交 ， 只 要 碰 到 路 上 有 人 等 公交 ， 就 停 下 来 载 人 。 

编译 型 语言 是 将 源 代码 完整 的 编译 成 目标 代码 后 才能 执行 ， 以 后 在 执行 时 不 需要 再 编译 。 
图 2-2 显示 了 一 个 编译 器 的 结构 ， 这 个 有 点 类 似 我 们 乘坐 的 直达 车 , 所 有 要 乘 车 的 人 都 从 起 点 
上 车 ， 中 途 不 再 搭载 其 他 乘客 。 
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图 2-1 解释 型 语言 的 执行 方式 


Lem | 


2-2 编译 型 语言 的 执行 方式 
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2.1.2 调试 


每 当 远 游 时 ， 司 机 肯定 要 做 几 件 事 情 ， 如 检查 发 动机 是 否 正常 、 检 查 油箱 、 检 查 各 项 安 
全 系统 和 液压 系统 等 ， 为 的 是 尽 可 能 减少 在 路 途中 发 生意 外 情况 。 

我 们 编程 也 是 一 样 的 ， 需 要 经 常 做 检查 。 有 一 些 问 题 编译 器 会 帮助 我 们 检查 出 来 ， 问 题 
查 出 后 ， 简 单 的 可 以 直接 解决 ， 对 于 稍微 复杂 的 ， 需 要 通过 调试 来 解决 。 

昌 序 是 很 容易 出 错 的 。 程 序 错误 被 称 为 bag， 查找 bug 的 过 程 称 为 调试 (debugging) 。 我 
们 在 第 1 章 中 已 经 介绍 过 一 个 很 简单 的 调试 示例 。 


2.1.3 ”语法 错误 


在 生活 中 有 时 会 碰 到 这 样 的 情况 ， 你 本 应 买 今天 去 某 地 的 火车 票 ， 已 经 买好 了 ， 但 当 进 
站 检票 时 ， 系 统 告诉 你 票 不 是 今天 的 ， 这 时 你 才 发 现 购买 车 票 时 输 错 了 日 期 。 

程序 中 这 种 错误 比 生活 中 出 现 的 次 数 多 很 多 ， 称 为 语法 错误 〈syntax errors) 。Python 程 
序 在 语法 正确 的 情况 下 才能 运行 , 否则 解释 器 会 显示 一 条 错误 信息 。 语 法 指 的 是 程序 的 结构 和 
此 结构 的 规则 。 比 如 第 1 章 的 (CHello,world!])， 括 号 中 的 单 引 号 是 成 对 的 ， 执 行 时 才能 正确 执 
行 。 如 果 输 入 (Hello,world!) 或 (Hello,world!) 就 会 报错 ， 这 属于 语法 错误 。 

我 们 在 阅读 文章 或 听 人 讲话 时 ， 可 以 容忍 大 多 数 语 法 错误 ， 不 过 Python 并 不 如 此 宽容 。 
程序 中 只 要 出 现 一 处 语法 错误 ，Python 就 会 显示 错误 信息 并 退出 ， 从 而 无 法 通过 编译 。 就 如 
我 们 进 站 ， 一 旦 票 不 满足 进 站 要 求 ， 就 无 法 进入 一 样 。 

在 编程 生涯 的 开始 阶段 ， 可 能 每 踏 出 一 步 都 会 碰 到 大 量 语 法 方面 的 错误 ， 随 着 经 验 的 增 
加 ， 犯 错 会 减少 ， 踩 过 坑 后 ， 后 面 遇 到 类 似 的 坑 就 能 快速 应 对 了 。 





2.1.4 ”运行 错误 

我 们 可 能 在 奔跑 的 交通 工具 内 愉悦 地 欣赏 着 远 途 的 风景 ， 但 此 时 交通 工具 突然 慢 慢 停 下 
来 了 ,并 且 司 机 对 大 家 宣布 说 ,交通 工具 抛锚 了 。 例如， 出 现 轮胎 破损 、 没 油 了 、 发 动机 坏 了 、 
撞车 事故 等 。 

在 Python 中 经 常会 遇 到 类 似 的 错误 ， 称 之 为 运行 时 错误 (runtime errors) 。 

即使 是 看 起 来 完美 无 缺 的 程序 ， 在 运行 的 过 程 中 也 会 出 现 错误 。 有 人 说 ， 计 算 机 不 是 善 
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于 精确 计算 吗 ? 确实 如 此 。 不 过 错 的 不 是 计算 机 , 而 是 我 们 人 类 。 计算机 说 到 底 是 人 类 设计 的 ， 
是 我 们 所 用 的 工具 ， 和 电视 机 、 汽 车 从 本 质 上 来 说 是 一 样 的 。 鉴 于 现在 计算 机 软 硬 件 的 理论 水 
平 、 工 业 制造 水 平 、 使 用 者 的 水 平等 一 些 内 在 、 外 在 的 因素 ， 出 现 错误 并 不 稀奇 ， 且 程序 越 复 
杂 , 出 现 异常 的 概率 越 大 。 异常 的 种 类 很 多 ,如 内 存 用 尽 、 除 数 为 零 的 除法 等 都 可 能 导致 异常 。 
Python 为 了 把 错误 的 影响 降 至 最 低 ， 提 供 了 专门 的 异常 处 理 语句。 

运行 时 错误 一 般 在 代码 量 偏 多 时 才 容 易 遇 到 。 


2.1.5 ”语义 错误 


经 常 乘坐 交通 工具 ， 难 免 有 乘 错 车 的 情况 出 现 ， 比 如 你 本 应 该 乘坐 801 路 车 ， 却 坐 上 了 
802 路 车 ， 结 果 到 达 了 不 同 的 地 方 。 

在 Python 中 经 常会 发 生 类 似 的 问题 ， 此 类 问题 称 为 语义 错误 (semantic errors) 。 

程序 即使 有 语义 错误 ， 也 能 正常 运行 ， 不 会 产生 任何 错误 信息 ， 但 得 到 的 结果 和 我 们 预 
料 的 不 一 致 。 发 生 这 种 错误 一 般 是 我 们 对 语句 的 运行 机 制 了 解 得 不 够 透彻 ， 自 以 为 它 应 该 如 此 
运行 , 实际 上 却 不 是 这 样 。 还 有 可 能 是 你 解决 问题 的 思路 本 身 就 是 错 的 , 写 的 程序 当然 是 错 的 。 

查找 语义 错误 并 不 像 我 们 坐 错 了 车 那么 容易 ， 它 可 能 需要 你 根据 结果 进行 推理 ， 不 过 推 
理 的 过 程 没有 那么 简单 易 行 ， 需 要 查看 程序 输出 ， 并 尝试 弄 明白 到 底 做 了 什么 。 


2.2 ”数据 类 型 


计算 机 是 可 以 做 数学 计算 的 机 器 ， 计 算 机 程序 理所当然 可 以 处 理 各 种 数值 。 计 算 机 能 处 
理 的 远 不 止 数值 ， 还 有 文本 、 图 形 、 音 频 、 视 频 、 网 页 等 各 种 各 样 的 数据 ， 不 同 的 数据 需要 定 
义 不 同 的 数据 类 型 。Python 3 中 有 6 种 标准 的 数据 类 型 : Number (数字 ) 、String (字符 串 ) 、 
List〈 列 表 ) 、Tuple (元 组 ) 、Sets〈 集 合 ) 、Dictionary (字典 ) 。 本 节 首 先 讲解 Number 数 
值 类 型 ， 其 他 5 种 数据 类 型 在 后 续 章 节 介绍 。 

Python 3 支持 3 种 不 同 的 数值 类 型 : 整 型 (int) 、 浮 点 型 (float) 、 复 数 (complex) 。 


2.2.1 整 型 


int 通常 被 称 为 整 型 或 整数 ， 是 正 、 负 整数 ， 不 带 小 数 点 。 在 Python 3 中 ， 整 型 没有 限制 
大 小 ， 可 以 当 作 long 类 型 使 用 ， 所 以 Python 3 没有 Python 2 的 long 类 型 。 

例如 ， 公 司 组 织 旅游 ， 大 家 坐 上 了 大 巴 准 备 出 发 ， 现 在 需要 统计 有 多 少 人 在 车 上 ，boss 
吟 只 小 萌 清点 一 下 人 数 ,小 萌 花 了 两 分 钟 逐个 点 了 一 遍 , 总 计 51 人 。 小 萌 在 交互 模式 下 输入 : 

>>> 51 

51 


这 里 使 用 的 是 整形 。 
到 服务 区 后 ， 大 家 休息 了 一 下 ， 再 次 准备 出 发 时 ，boss 又 只 只 小 萌 清 点 一 下 人 数 。 小 萌 
苦笑 一 下 , 看 来 又 得 花 两 分 钟 清点 人 数 了 , 为 什么 不 叫 一 个 人 帮忙 从 车 的 另 一 头 清点 呢 ? 于 是 
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小 萌 叫 小 智 帮忙 从 另 一 头 清点 一 下 人 数 。 一 分 钟 后 ， 小 萌 和 小 智 在 车 中 间 碰 上 了 ,小 智 告诉 小 
萌 他 的 计数 是 25 人 ， 小 萌 在 交互 模式 下 输入 : 

>>> 25+25 

50 


小 萌 准 备 把 数字 报告 给 boss， 突 然 想到 上 次 报告 的 是 51 人 ， 这 次 是 50 人 ， 数 字 不 同 啊 ， 
还 差 1 人 ， 小 萌 在 交互 模式 下 输入 : 

>>> 51-50 

1 


怎么 少 了 一 人 了 呢 ? 小 萌 突 然 慌 了 ， 然 后 仔细 一 想 ， 原 来 是 把 自己 忘 加 上 了 ， 于 是 再 次 输入 : 

>>> 25+25+1 

51 

这 次 没 问 题 了 。 于 是 小 萌 给 了 boss 和 上 次 一 样 的 答案 。boss 示意 司机 可 以 发 车 了 ， 又 突 
然 叫 停 , 看 天 气 挺 热 的 ， 大 家 路 上 可 能 会 口 渴 ， 于 是 吟 只 小 萌 去 服务 区 给 每 人 买 两 瓶 水 ,再 买 

-大 包 糖 给 大 家 在 路 上 补充 能 量 。 每 人 两 瓶 水 ， 一 共 要 买 多 少 瓶 呢 ? 小 萌 在 交互 模式 下 输入 : 
>>> 5142 
102 


- 共 要 买 102 瓶 水 ， 这 么 多 ， 于 是 小 萌 让 小 智 帮忙 一 起 去 提 水 。 

水 和 糖 都 买 回 来 了 ， 水 好 分 ， 给 每 人 两 瓶 就 是 ， 这 一 大 包 糖 该 怎么 给 大 家 呢 ? 看 包装 袋 
上 有 总 颗 数 ， 一 共有 153 颗 ， 每 人 多 少 颗 呢 ? 小 萌 在 交互 模式 下 输入 

>>> 153/51 

3.0 

好 了 ， 给 每 人 发 3 颗 糖 就 可 以 了 。 于 是 小 萌 高 高 兴 兴 发 糖 去 了 ， 小 智也 帮忙 一 起 发 ， 每 
人 给 3 颗 。 糖 终 于 发 完了 ,小 萌 很 恢 意 , 坐 下 来 补充 能 量 。 小 萌 突 然 想到 了 什么 有 153 颗 糖 ， 
分 给 51 人 ， 每 人 3 颗 糖 没 错 ， 但 计算 出 来 的 结果 怎么 是 3.0 呢 ? 假如 有 155 颗 糖 ， 计 算 结果 
会 是 怎样 的 呢 ? 输入 以 下 数据 : 

>>> 155/51 

3.0392156862745097 


如 果 按 这 个 结果 分 ， 就 没有 办 法 分 了 。 这 是 怎么 回 事 呢 ? 

原因 是 : 在 整数 除法 中 ， 除 法 (/) 计算 结果 是 浮 点 数 ， 即 使 两 个 整数 恰好 整除 ， 结 果 也 
是 浮 点 数 。 如 果 只 想得到 整数 的 结果 ， 于 弃 可 能 的 分 数 部 分 ， 可 以 使 用 地 板 除 (//) ， 整 数 的 
地 板 除 (1/) 永远 是 整数 ， 即 使 除 不 尽 。 

更 改 前 面 输入 的 数据 : 

>>> 153/51 

3 


这 时 就 不 是 浮 点 数 了 。 再 看 看 155 颗 糖 的 结果 : 
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>>> 155//51 
2 


153 和 155 除 以 51 都 是 3， 这 个 就 不 对 了 。 原 来 还 有 一 个 余数 。 

因为 地 板 除 (/) 只 取 结 果 的 整数 部 分 ， 所 以 Python 提供 了 一 个 余数 运算 ,可 以 得 到 两 个 
整数 相 除 的 余数 ， 看 看 153 和 155 对 51 的 取 余 : 

>>> 153%51 

0 

>>> 155%51 

2 


这 次 的 结果 就 是 想 要 的 了 。 假 如 有 155 颗 糖 ， 就 会 多 出 2 蜂 。 小 萌 细 细 想 着 ， 嘴 角 泛 起 
- 丝 自然 的 微笑 , 小 智也 发 完 糖 了 , 过 来 向 小 萌 汇 报 , 看 见 小 萌 的 表情 , 小 智 心里 顿时 暖 暖 的 ， 
无 须 报告 了 。 


2.2.2 浮 点 型 


浮 点 型 由 整数 部 分 与 小 数 部 分 组 成 ， 也 可 以 使 用 科学 计数 法 表示 。 

比如 ， 小 萌 还 在 细 想 中 ，boss 突然 打 断 了 她 的 思维 ， 问 她 总 共 花 了 多 少 钱 。 小 萌 理 了 一 
下 思绪 ， 每 瓶 水 3.3 元 ， 一 共 102 瓶 ， 总 共 多 少 钱 呢 ? 输入 如 下 : 

>>> 3.3*102 

336.59999999999997 


结果 怎么 这 么 长 ?小 萌 看 傻 了 ， 不 过 冷静 一 看 ， 原 来 是 ， 整 数 和 浮 点 数 在 计算 机 内 部 存 
储 的 方式 不 同 ， 整 数 运算 永远 是 精确 的 ， 而 浮 点 数 运算 可 能 会 有 四 合 五 入 的 误差 。 

“boss， 一 共 336.6 元 ”。“ 好 的 ， 加 上 买 糖 的 钱 了 吗 ”? 小 萌 暗 时 自己 ， 瞧 我 这 脑筋 。 
再 计算 一 次 ， 每 瓶 水 3.3 元 ， 一 共 102 瓶 ， 再 加 上 一 包 糖 15.5 元 ， 输 入 如 下 : 





>>> 3.3*102+15.5 

352.09999999999997 

这 结果 好 像 很 凌乱 ， 应 该 这 么 输入 : 
>>> 336.6+15.5 

352.1 


这 个 结果 就 好 看 多 了 。 报 告 给 boss， 一 共 花 费 352.1 元 。 

小 萌 又 开始 思考 了 ， 浮 点 数 相 乘 结果 这 么 怪 ， 浮 点 数 的 除法 是 怎样 的 呢 ? 想到 了 就 实践 ， 
输入 如 下 : 

>>> 153/51.0 

3.0 


这 个 结果 和 153 除 以 51 的 结果 是 一 样 的 ， 如 果 155 除 以 51.0 呢 ? 输入 如 下 : 
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>>> 155/51.0 
3.0392156862745097 


结果 和 155 除 以 51 也 是 一 样 的 。 那 做 地 板 除 和 取 余 又 是 怎样 的 呢 ? 输 入 如 下 : 
>>> 155/51.0 
3.0 


>>> 155%51.0 
2.0 


可 以 看 出 ， 得 到 的 结果 都 是 浮 点 型 的 。 
2.2.3 ”复数 


复数 由 实数 部 分 和 虚数 部 分 构成 ， 可 以 用 a + bj 或 complex(a,b) 表 示 ， 复 数 的 实 部 a 和 虚 
部 b 都 是 浮 点 型 。 

Python 支持 复数 ， 不 过 Python 的 复数 我 们 当前 阶段 使 用 或 接触 的 比较 少 ， 此 处 就 不 再 具 
体 讲解 ， 读 者 有 一 个 概念 即 可 ， 有 兴趣 可 以 自行 查阅 相关 资料 。 


2.2.4 ”数据 类 型 转换 


有 时 我 们 要 对 数据 内 置 的 类 型 进行 转换 ， 只 需要 将 数据 类 型 作为 函数 名 即 可 。 
数据 的 类 型 转换 时 有 如 下 4 个 函数 可 以 使 用 : 
int(x) 将 x 转换 为 一 个 整数 。 
float(x) 将 x 转换 为 一 个 浮 点 数 。 
complex(x) 将 x 转换 为 一 个 复数 ， 实 数 部 分 为 x， 虚 数 部 分 为 0。 
complex(x, y) 将 x 和 y 转换 为 一 个 复数 ， 实 数 部 分 为 x， 虚数 部 分 为 y。x 和 y 是 数字 
比如 ， 小 萌 去 购物 ， 计 算出 应 付 金额 是 352.1 元 ， 超 市 老板 为 免除 找 零 的 麻烦 ， 让 小 萌 支 
付 352 元 。Python 中 的 转换 可 以 如 下 执行 : 
>>> int(352.1) 
Ed 


很 容易 就 得 到 了 转换 后 的 结果 。 但 是 金额 的 操作 必须 用 浮 点 数 进 行 记 账 ， 这 个 容易 ， 用 
float 函数 就 行 了 。 输 入 如 下 : 

>>> float(352.1) 

Ey | 

这 样 就 得 到 了 浮 点 型 数据 。 

结果 跟 输 入 的 一 样 ， 这 下 怎么 办 呢 ? 把 int 函数 放 入 float 函数 中 是 否 可 以 呢 ? 尝试 一 下 : 

>>> float(int(352.1)) 

352.0 
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这 里 先 把 352.1 取 整 ， 得 到 整数 332， 再 用 float 将 352 转换 成 浮 点 数 352.0， 这 样 就 得 到 
我 们 需要 的 结果 了 。 虽 然 输入 的 字符 看 起 来 有 点 复杂 ， 但 是 还 是 得 到 结果 了 。 
这 其 实 是 函数 的 嵌 套 ， 后 面 会 进行 具体 介绍 ， 此 处 做 相关 了 解 即 可 。 


2.2.5 ”常量 

所 谓 常 量 ， 就 是 不 能 变 的 变量 ， 比 如 常用 的 数学 常数 就 是 一 个 常量 。 在 Python 中 ， 通 
常用 全 部 大 写 的 变量 名 表示 常量 。 

Python 中 有 两 个 比较 常见 的 常量 ， 即 PI 和 E。 


e@ PI: 数学 常量 pi ( 圆周率， 一般 以 x 表示 )。 
ee E: 数学 常量 e， 即 自然 常数 。 


这 两 个 常量 将 会 在 后 续 章节 中 使 用 ， 具 体 的 用 法 在 使 用 中 体现 。 
2.3 ”变量 和 关键 字 


编程 语言 最 强大 的 功能 之 一 是 操纵 变量 。 变 量 (variable》 是 一 个 需要 熟知 的 概念 ， 如 果 
你 觉得 数学 让 你 抓 狂 ， 别 担心 ，Python 中 的 变量 很 好 理解 。 变 量 基 本 上 代表 某 个 值 的 名 字 。 


2.3.1 变量 


变量 指向 各 种 类 型 值 的 名 字 ， 以 后 再 用 到 这 个 值 时 ， 直 接 引 用 名 字 即 可 ， 不 用 再 写 具体 
的 值 。 在 Python 中 ， 变 量 的 使 用 环境 非常 宽松 ， 没 有 明显 的 变量 声明 ， 而 且 类 型 不 是 固定 的 。 
你 可 以 把 一 个 整数 赋值 给 变量 ， 如 果 觉 得 不 合适 ， 把 字符 串 赋 给 变量 也 可 以 。 

在 Python 中 ， 等 号 (=) 是 赋值 语句 ， 可 以 把 任意 数据 类 型 赋值 给 变量 。 

如 果 要 定义 一 个 名 为 xiaohong 的 变量 ， 该 怎么 操作 呢 ? 输入 如 下 : 

>>> xiaohong='XiaoHong' 

>>> 


字符 串 必须 以 引号 标记 开始 ， 并 以 引号 标记 结束 。 
注 意 
此 操作 解释 : xiaohong 是 我 们 创建 的 变量 ，= 是 赋值 语句 ，XiaoHong 是 变量 值 ， 需 要 用 引 
号 标记 。 整 句 话 的 意思 为 : 创建 变量 xiaohong 并 赋值 为 XiaoHong。 
小 萌 疑 惑 了 ， 怎 么 前 面 输入 后 按 回 车 键 就 能 输出 内 容 ， 这 里 怎么 跳 到 输入 提示 状态 呢 ? 
别 急 ， 还 记得 前 面 讲 的 print0 吗 ?print0 是 输出 函数 ， 看 看 这 里 ， 没 有 使 用 输出 函数 ， 屏 幕 上 
当然 不 会 输出 内 容 了 。 要 输出 内 容 应 该 怎么 操作 呢 ? 我 们 尝试 一 下 : 


>>> print(xiaohong) 





XiaoHong 


*29 
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不 错 ， 尝 试 成 功 了 。 但 为 什么 小 萌 输 入 的 是 print(xiaohong)， 结 果 却 输出 XiaoHong 呢 ? 
这 就 是 变量 的 好 处 ， 可 以 只 定义 一 个 变量 ， 比 如 xiaohong， 把 一 个 值 赋 给 这 个 变量 ， 比 如 
XiaoHong， 这 样 当 我 们 输出 xiaohong 时 ， 实 际 上 输出 的 是 XiaoHong。 

在 使 用 变量 前 需要 对 其 赋值 。 没 有 值 的 变量 是 没有 意义 的 ， 编 译 器 也 不 会 编译 通过 。 例 
如 ， 定 义 一 个 变量 为 abc， 不 赋 任 何 值 ， 输 入 及 结果 如 下 : 

>>> abc 

Traceback (most recent call last): 

File "<pyshell#33>", line 1, in <module> 
abc 
NameError: name 'abc' is not defined 


同一 个 变量 可 以 反复 赋值 ， 而 且 可 以 是 不 同类 型 的 变量 ， 输 入 如 下 : 

>>>a= 123 

123 

>>> a=' ABC' 

>>> print(a) 

ABC 

这 种 变量 本 身 类 型 不 固定 的 语言 称 为 动态 语言 ， 与 之 对 应 的 是 静态 语言 。 静 态 语言 在 定 
义 变量 时 必须 指定 变量 类 型 ,如 果 赋 值 时 类 型 不 匹配 就 会 报错 。 和 静态 语言 相 比 ， 动 态 语言 更 

当 不 能 确定 变量 或 数据 的 类 型 时 ， 可 以 借助 解释 器 内 置 的 函数 type 进行 确认 。 在 交互 模 
式 下 可 以 如 下 输入 : 


>>> type('Hello,world!') 


<class 'str> 

测试 得 到 输入 的 结果 类 型 是 字符 串 类 型 (str) 。 
>>> type(100) 

<class 'int> 

测试 得 到 输入 的 结果 类 型 是 整 型 (int) 。 

>>> type(3.0) 

<class 'float'> 

测试 得 到 输入 的 结果 类 型 是 浮 点 型 (float) 。 





>>> a='test type' 
>>> type(a) 
<class 'str> 


测试 得 到 输入 的 结果 类 型 是 字符 串 类 型 (str) 。 
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>>> b=100 
>>> type(b) 


<class 'int> 
测试 得 到 输入 的 结果 类 型 是 整 型 (int) 。 


>>> c=3.0 


>>> type(©) 
<class 'float> 


测试 得 到 输入 的 结果 类 型 是 浮 点 型 (float)。 
只 要 是 用 双 引 号 或 单 引号 括 起 来 的 值 ， 都 属于 字符 串 。 交 互 模式 下 输入 : 
>>> type('test single quotes') 

<class Str> 

>>> type("test double quote") 

<class 'str> 

>>> type("100") 

<class Str> 

>>> type("3.0") 

<class 'str> 

>>> b=3 

>>> type(b) 

<class 'int> 

>>> b=100 

>>> type(b) 

<class 'int> 

>>> c=3.0 

>>> type(©) 

<class 'float> 


测试 得 到 输入 的 结果 类 型 都 是 字符 串 类 型 (str) 。 

注意 不 要 把 赋值 语句 的 等 号 等 同 于 数学 中 的 等 号 。 比 如 下 面 的 代码 : 
a=100 

a=a+200 


小 萌 一 脸 疑 问 ，a = a + 200 是 什么 等 式 啊 ? 读书 时 不 知道 在 这 个 等 式 上 花费 了 多 少 脑 细 
胞 ,可 别 再 拿 这 个 骗 我 了 , 我 可 是 读 过 小 学 的 。 小 萌 啊 小 萌 ， 计算 机 可 不 是 人 脑 ， 也 不 需要 遵 
循 学 校 的 知识 ， 计 算 机 有 计算 机 的 思考 方式 。 在 编程 语言 中 ， 赋 值 语句 先 计算 右 侧 的 表达 式 a 
+ 200， 得 到 结果 300， 再 赋 给 变量 a。 由 于 a 之 前 的 值 是 100， 重 新 赋值 后 ，a 的 值 变 成 300。 
我 们 通过 交互 模式 验证 ， 输 入 如 下 : 


>>> a=100 

















>>> a=at+200 
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>>> print(a) 

300 

和 我 们 所 描述 的 结果 一 致 。 

理解 变量 在 计算 机 内 存 中 的 表示 也 非常 重要 。 当 我 们 输入 如 下 : 


>>> a= ABC 
这 时 ，Python 解释 器 做 了 两 件 事情 : 


(1) 在 内 存 中 创建 了 一 个 'ABC' 字 符 串 。 
(2) 在 内 存 中 创建 了 一 个 名 为 a 的 变量 ， 并 把 它 指向 'ABC'。 


也 可 以 把 一 个 变量 a 赋值 给 另 一 个 变量 b, 这 个 操作 实际 上 是 把 变量 b 指向 变量 a 所 指向 
的 数据 ， 例 如 下 面 的 代码 : 

>>> a='ABC' 

>>> b=a 

>>> a=XYZ' 

>>> print(b) 

最 后 一 行 输出 变量 b 的 内 容 到 底 是 'ABC' 还 是 'XYZ' 呢 ? 如 果 从 数学 意义 上 理解 , 就 会 错误 
地 得 出 b 和 a 相同 ， 应 该 是 'XYZ'。 实 际 上 ，b 的 值 是 'ABC'。 我 们 一 行 一 行 执行 代码 ， 就 可 以 
看 到 到 底 发 生 了 什么 事 。 

执行 a='ABC'， 解 释 器 创建 了 字符 串 'ABC' 和 变量 a， 并 把 a 指向 'ABC'， 如 图 2-3 所 示 。 








Str 
一“ "ABC" 
a | 
图 2.3 a 指向 ABC' 


执行 b=a， 解 释 器 创建 了 变量 b， 并 把 b 指 向 a 指向 的 字符 串 'ABC'"， 如 图 2-4 所 示 。 


str 


-pi "ABC" 
E4 


2-4 a、b 指向 'ABC' 


执行 a='XYZ', 解释 器 创建 了 字符 串 'XYZ'， 并 把 a 的 指向 改 为 XYZ', 但 b 没有 更 改 ， 如 
图 2-5 所 示 。 





str 


"ABC" 
a LL 
b ea str 


“XYZ" 
2-5 a 指向 XYZ', b 不 变 
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最 后 输出 变量 b 的 结果 自然 是 'ABC'T 了 。 
2.3.2 ”变量 名 称 


程序 常常 选择 有 意义 的 名 称 作为 变量 名 ， 以 此 标记 变量 的 用 途 。 

变量 名 是 由 数字 或 字符 组 成 的 任意 长 度 的 字符 串 ， 必 须 以 字母 开头 。 使 用 大 写字 母 是 合 
法 的 , 但 变量 名 建议 使 用 小 写字 母 开 头 。.Python 是 区 分 大 小 写 的 。 举 个 例子 来 说 , Name 和 name 
是 两 个 不 同 的 变量 名 。 交 互 模式 中 输入 如 下 : 

>>> name='study python is happy” 

>>> Name='] aggree with you' 

>>> print(name) 

study python is happy 

>>> print(Name) 

I aggree with you 

下 划 线 “_” 可 以 出 现在 变量 名 中 ， 经 常用 于 连接 多 个 词组 ， 如 happy_study, do _it_with_ 
more_practice。 交 互 模式 输入 如 下 : 

>>> happy_study='stay hungry stay foolish' 

>>> print(happy_study) 

stay hungry stay foolish 

如 果 给 变量 取 非 法 的 名 称 ， 解 释 器 就 会 显示 语法 错误 。 请 看 下 面 的 示例 : 

>>> 2wrongtest='just for test 

SyntaxError: invalid syntax 

该 示例 提示 语法 错误 ， 错 误 信 息 为 无 效 的 语法 ， 原 因为 不 是 以 字母 开头 的 。 

>>> xiaoming(Ome= surprised' 

SyntaxError: can't assign to operator 

该 示例 提示 语法 错误 ， 错 误 信息 为 不 能 做 指定 操作 ， 原 因 是 包含 一 个 非法 字符 @。 

Python 不 允许 使 用 关键 字 作 为 变量 名 ， 请 看 下 面 的 例子 : 

>>> from='from' 

SyntaxError: invalid syntax 

from 是 Python 的 一 个 关键 字 ， 因 此 出 现 错误 。 

Python 3 中 共有 33 个 关键 字 ， 都 不 能 作为 变量 名 来 使 用 。 


False None Tme and as assert ”break 
class continue def del elif else except 
finally for from global if import in 
nonlocal lambda is not or pass Taise 
retum try while with yield 
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24 语 名 


语句 是 Python 解释 器 可 以 运行 的 一 个 代码 单元 ， 也 可 以 理解 为 可 以 执行 的 命令 。 我 们 目 
前 已 经 使 用 了 两 种 语句 : print 打印 语句 和 赋值 语句 。 

赋值 语句 有 两 个 作用 : 一 是 建立 新 的 变量 ， 二 是 将 值 赋 予 变量 。 任 何 变量 在 使 用 时 都 必 
须 赋值 ， 否 则 会 被 视 为 不 存在 的 变量 。 

看 了 上 百 字 ， 也 没 明 白 什么 是 语句 ， 小 萌 暗 自 抱 忽 到 。 于 是 她 随手 在 交互 模式 下 输入 
如 下 : 

>>> advice='boss,we want have a lunch' 


刚 输 完 一 句 ， 小 萌 就 停 下 了 ， 等 等 ， 刚 才 输 入 的 不 就 是 语句 吗 ? 前 面 都 做 过 不 少 示 例 了 ， 
看 看 还 用 过 什么 语句 。 在 交互 模式 下 写 的 第 一 个 程序 不 就 是 print 语句 吗 ? 对 了 ， 还 可 以 知道 
这 个 语句 中 advice 的 类 型 是 什么 样 的 。 小 萌 想 完 ， 在 交互 模式 下 输入 如 下 


>>> type(advice) 
<class str> 


这 个 语句 中 advice 的 类 型 是 字符 串 〈str) 类 型 。 还 有 什么 类 型 的 赋值 语句 呢 ? 对 了 ， 前 
面 还 学 习 了 整 型 和 浮 点 型 ， 交 互 模式 输入 : 

>>> money=99999999 

>>> type(money) 

<class 'int> 

>>> spend=1.11111111 

>>> type(spend) 

<class 'float'> 


不 错 ， 把 之 前 学 习 的 温习 了 一 下 。 于 是 小 萌 又 在 交互 模式 下 输入 如 下 
>>> so happy 
SyntaxError: invalid syntax 


哎呀 ， 怎 么 又 犯 糊 涂 了 ， 变 量 是 一 定 要 赋值 的 。 于 是 重新 输入 


>>> print('so happy,it is a perfect forenoon') 
So happy,it is a perfect forenoon 


小 萌 突 然 感觉 有 人 站 在 自己 旁边 ， 原 来 是 小 智 。 小 智 盯 着 交互 模式 输入 界面 ， 突 然 说道 : 
“这 个 用 状态 图 展示 会 更 直观 ”。 说 完 就 帮 小 萌 画 出 了 一 个 变量 状态 图 ， 如 图 2-6 所 示 。 

一 般 情 况 下， 我 们 用 状态 图 表示 变量 的 状态 。 左 边 是 变量 名 称 ， 右 边 是 变量 值 。 状 态 图 
显示 了 赋值 语句 的 最 终 操作 结果 。 
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图 2-6 变量 的 状态 图 


原来 小 智 知道 这 么 多 ， 小 萌 心 中 上 暗暗 高 兴起 来 ， 感 谢 小 智 的 指导 。 这 真是 一 个 愉快 的 上 
午 ， 不 过 真 的 很 饿 。 好 像 到 服务 区 了 。boss 宣布 在 这 里 休息 一 下 ， 顺 便 补充 点 能 量 再 往 前 走 。 


2.5 表达 式 


表达 式 是 值 、 变 量 和 操作 符 的 组 合 。 单 独 一 个 值 可 以 看 作 表达 式 ， 单 独 的 变量 也 可 以 看 
作 表 达 式 。 

这 个 怎么 理解 呢 ?” 小 萌 不 解 地 看 着 这 么 短 短 一 条 语句 ， 脑 袋 怎么 都 拐 不 过 弯 。“ 今 天 的 
午餐 真 不 错 ”， 原 来 是 小 智 ， 小 萌 突 然 来 了 精神 ， 可 以 向 小 智 请 教 请 教 啊 。 

“小 智 ， 中 午 好 ， 能 帮 有 我 看 看 这 个 怎么 理解 吗 ? ”小 智 过 去 看 了 看 ， 思 考 了 一 下 ， 给 小 
萌 做 了 如 下 讲解 。 

表达 式 和 语句 一 般 不 容易 区 分 ， 很 多 人 会 将 两 者 混在 一 起 。 那 么 语句 和 表达 式 之 间 有 什 
么 区 别 呢 ? 

表达 式 是 某 事 ， 语 句 就 是 做 某 事 ， 也 就 是 告诉 计算 机 做 什么 。 比 如 3*3 是 9，print(3*3) 
输出 也 是 9。 区 别 在 哪里 呢 ? 我 们 在 交互 模式 下 输入 如 下 : 


>>> 3*3 

9 

>>> print(3*3) 

9 

在 交互 模式 下 ， 结 果 都 是 一 样 的 。 这 是 因为 解释 器 总 是 输出 所 有 表达 式 的 值 〈 内 部 都 使 
用 相同 的 函数 对 结果 进行 呈现 ， 后 面 会 有 详细 介绍 ) 。 一 般 情 况 下 ，Python 不 会 这 么 做 ， 毕 
竞 3*3 这 样 的 表达 式 不 能 做 什么 有 趣 的 事情 ， 而 编写 print(3*3) 会 有 一 个 显 式 的 输出 结果 9。 

语句 和 表达 式 之 间 的 区 别 在 赋值 时 表现 得 更 加 明显 。 因 为 语句 不 是 表达 式 ， 所 以 没有 值 
可 供 交 互 式 解 释 器 输出 。 比 如 在 交互 模式 下 输入 如 下 : 


>>> a=100 
>>> 
>>> 10*10 
100 
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从 输入 结果 可 以 看 到 ， 赋 值 语句 输入 完成 后 ， 下 面 立刻 出 现 了 新 的 提示 输入 符 。 表 达 式 
输入 完成 后 ， 下 面 立刻 得 到 了 结果 。 不 过 对 于 赋值 语句 ， 有 些 东西 已 经 变 了 ， 变 量 a 现在 绑 定 
了 一 个 值 100。 

这 个 是 语句 特性 的 一 般 定 义 : 它们 改变 了 事物 。 比 如 ， 赋 值 语 名 改变 了 变量 ，print 语句 
改变 了 屏幕 显示 的 内 容 。 

赋值 语句 可 能 是 所 有 计算 机 程序 设计 语言 中 最 重要 的 语句 类 型 ， 尽 管 现 在 还 难以 说 清 赋 
值 语句 的 重要 性 。 变 量 就 像 临时 的 “存储 器 ”( 就 像 厨 房 中 的 锅 碗 新 贫 一 样 ) ， 强 大 之 处 在 于 ， 
在 操作 变量 时 并 不 需要 知道 存储 了 什么 值 。 比 如 ,即使 不 知道 x 和 y 的 值 到 底 是 多 少 ,也 会 知 
道 x*y 的 结果 就 是 x 和 y 的 乘积 。 所 以 , 可 以 通过 多 种 方法 使 用 变量 , 而 不 需要 知道 在 程序 运 
行 时 ， 最 终 存储 的 值 是 什么 。 


2.6 ”运算 符 和 操作 对 象 








运算 符 和 操作 对 象 是 计算 机 中 比较 常见 的 ， 所 有 计算 都 涉及 运算 符 和 操作 对 象 。 本 节 将 
介绍 Python 中 的 运算 符 和 操作 对 象 。 


2.6.1 什么 是 运算 符 和 操作 对 象 


运算 符 是 一 些 特殊 符号 的 集合 ， 我 们 前 面 学 习 的 加 (+) 、 减 (-) 、 乘 (*) 、 除 (/) 、 
地 板 除 (/) 、 取 余 〈%) 等 都 是 运算 符 。 操 作对 象 是 由 运算 符 连 接 起 来 的 对 象 。 加 、 减 、 乘 、 
除 4 种 运算 符 是 我 们 从 小 学 就 开始 接触 的 , 不 过 乘除 的 写法 不 一 样 ， 这 个 要 记 住 。 小 萌 看 到 这 
个 标题 后 快速 回忆 ， 这 个 学 习 方 式 不 错 ， 不 但 能 温 故 知 新 ， 还 做 了 联想 记忆 和 纵向 比 对 ,值得 
借鉴 。 

Python 支持 以 下 8 种 运算 符 : 

(1) 算术 运算 符 。 

(2) 比较 (关系 ) 运算 符 。 

(3) 赋值 运算 符 。 

(4) 逻辑 运算 符 。 

(5) 位 运算 符 。 

(6) 成 员 运算 符 。 

(7) 身份 运算 符 。 

(8) 运算 符 优先 级 。 


这 么 多 ， 看 来 今天 可 以 大 开眼 界 了 ， 小 萌 心 里 一 阵 狂 喜 。 
接 下 来 让 我 们 一 个 一 个 学 习 吧 ! 


2.6.2 ”算术 运算 符 
表 2-1 为 算术 运算 符 的 描述 和 实例 。 假 设 变量 a 为 10， 变 量 b 为 5。 
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表 2-1 算术 运算 符 


运算 符 描述 实例 
再 加 : 两 个 对 象 相 加 a+b 输出 结果 为 15 
- 减 : 得 到 负数 或 一 个 数 减 去 另 一 个 数 a-b 输出 结果 为 5 
乘 : 两 个 数 相 乘 或 返回 一 个 被 重复 若干 次 的 字符 串 | a* b 输出 结果 为 50 
/ 除 : x 除 以 y a/b 输出 结果 为 2.0 
% 取 模 : 返回 除法 的 余数 b % a 输出 结果 为 0 
RE 军 : 返回 x 的 y 次 宕 a**b 为 10 的 5 次 方 ， 输 出 结果 为 100000 
// 取 整 除 〈 地 板 除 ): 返回 商 的 整数 部 分 9//2 输出 结果 为 4，9.0//2.0 输出 结果 为 4.0 
下 面 进行 实战 。 在 交互 模式 输入 如 下 : 
>>> a=10 
>>> b=5 
>>> print(a+b) 
15 
>>> print(a-b) 
SE] 
>>> print(a*b) 
50 
>>> print(a/b) 
2.0 
>>> print(a**b) 
100000 
>>> print(9//2) 
4 
>>> print(9.0//2.0) 
4.0 


此 处 的 加 、 减 、 乘 、 除 ， 取 余 、 取 整除 前 面 都 已 经 做 过 详细 介绍 ， 较 好 理解 。 但 是 老 运 
算 与 数学 中 学 习 的 乘 方 运算 的 形式 是 不 一 样 的 ， 是 ?这 样 的 形式 。 有 没有 更 好 的 方式 让 人 更 
容易 记 住 这 个 符号 呢 ? 

有 一 个 很 好 的 例子 ， 为 什么 会 出 现 32 位 和 64 位 操作 系统 ， 并 且 现 在 大 家 都 趋向 于 安装 
64 位 的 软件 。 先 看 交互 模式 下 的 两 个 输入 : 

>>> 2**32/1024/1024/1024 

4.0 

>>> 2**64/1024/1024/1024 

17179869184.0 


第 一 个 输入 ，2**32 是 2 的 32 次 方 ， 这 是 32 位 操作 系统 最 大 支持 内 存 的 字 节 数 ， 除 以 第 
-个 1024 是 转换 为 KB，1KB=1024B， 除 以 第 二 个 1024 是 转换 为 MB，1MB=1024KB， 除 以 
第 三 个 1024 是 转换 为 GB，1GB=1024MB。 这 个 结果 意味 着 32 位 操作 系统 最 大 只 能 支持 4GB 
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的 内 存 ， 现 在 手机 都 是 4GB 标 配 了 ， 电 脑 4GB 怎么 够 呢 ? 所 以 大 家 都 趋向 于 选择 64 位 操作 
系统 了 ，64 位 操作 系统 能 支持 多 大 内 存 ， 大 家 可 以 自行 计算 一 下 。 


2.6.3 ”比较 运算 符 
表 2-2 为 比较 运算 符 的 描述 和 实例 。 以 下 假设 变量 a 为 10、 变 量 b 为 20。 


表 2-2 ”比较 运算 符 


运算 符 描述 


实例 





等 于 : 比较 对 象 是 否 相 等 


(a 一 b) 返回 False。 





不 等 于 : 比较 两 个 对 象 是 否 不 相等 


(a!=b) 返回 True. 




















> 大 于 : 返回 x 是 否 大 于 y (a>b) 返回 False。 
小 于 : 返回 x 是 否 小 于 y。 所 有 比较 运算 符 返回 1 表示 真 ， 返 回 0 表示 

i (a<b) 返回 True。 
假 ， 与 特殊 的 变量 True 和 False 等 价 。 注 意 大 写 的 变量 名 。 

>= 大 于 等 于 返回 x 是 否 大 于 等 于 y。 (a>=b) 返回 False。 

<= 小 于 等 于 : 返回 x 是 否 小 于 等 于 y。 (a<=b) 返回 True。 





下 面 进行 实战 。 
>>> a=10 
>>> b=20 
>>> a==b 
False 
>>> al=b 
True 
>>> a>b 
False 
>>>a<b 
True 
>>> a>=b 
False 
>>>a<=b 
True 
>>> a+10>=b 
True 
>>> a+10>b 
False 
>>> a<=b-10 
True 
>>> a<b-10 
False 
>>>a==b-10 


True 
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小 智 : 小 萌 ， 注 意 到 比较 运算 的 特色 了 吗 ? 

小 萌 : 比较 运算 只 返回 True 和 False 两 个 值 。 

小 智 : 对 的 , 能 看 出 比较 运算 符 两 边 的 值 和 比较 的 结果 有 什么 特色 吗 , 特别 是 对 于 ==、<、 
>、<=、>= 这 5 个 比较 运算 符 的 结果 ? 

小 萌 : 让 我 仔细 观察 观察 ， 对 于 这 些 比 较 运算 ， 只 要 左边 和 右边 的 操作 数 满足 操作 符 的 
条 件 ， 结 果 就 是 True， 不 满足 就 是 False。 

小 智 : 你 理解 的 没 错 ， 其 实 可 以 通俗 地 理解 为 ， 比 较 结构 符合 大 家 的 心里 预期 ， 结 果 就 
是 True， 不 符合 结果 就 是 False。 比 如 上 面 的 例子 中 a<b， 即 10<20， 符 合 大 家 的 预期 ， 就 返 
回 True; 对 于 a==b， 即 10 一 20， 大 家 一 眼 就 能 看 出 这 两 者 不 相等 ， 就 返回 False。 








【分 在 一 些 地方 ， 会 用 1 代表 True、0 代表 False， 这 是 正确 也 是 合理 的 表示 方式 。 大 家 可 以 
理解 为 开 和 关 , 就 像 我 们 在 物理 中 所 学 的 电流 的 打开 和 关闭 一 样 。 后 面 会 有 更 多 地 方 用 1 
和 0 代表 True 和 False。 


另外 ， 在 Python 2 中 ， 有 时 会 看 到 之 符号。 和 != 一 样 ， 全 也 表示 不 等 于 ， 在 Python 3 中 
已 去 除 该 符号 。 若 以 后 看 到 人 运算 符 ， 则 使 用 的 是 Python 2。 


2.6.4 ”赋值 运算 符 
表 2-3 为 赋值 运算 符 的 描述 和 实例 。 假 设 变量 a 为 10， 变 量 b 为 20。 




















表 2-3 ”赋值 运算 符 

运算 符 描述 实例 
简单 的 赋值 运算 符 c=a+b， 将 a+b 的 运算 结果 赋值 给 c 
4 加 法 赋值 运算 符 c+=a， 等 效 于 c=c+a 
-= 减法 赋值 运算 符 c-=a， 等 效 于 c=c-a 
Ne 乘法 赋值 运算 符 c*=a， 等 效 于 c=c*a 
= 除法 赋值 运算 符 c/=a， 等 效 于 c=c/a 
%= 取 模 赋值 运算 符 c%=a， 等 效 于 c=c%a 
bie 和 军 赋 值 运算 符 c+*#4=a， 等 效 于 c=c**a 
We 取 整 (地 板 〉 除 赋值 运算 符 c/ 厂 a， 等 效 于 c=c/a 

下 面 进 行 实战 。 

>>>a=10 

>>> b=20 

>>> c=0 

>>> c=atb 

>>> print(c) 

30 

>>>ct=10 

>>> print(c) 
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40 

>>> c-=a 
>>> print(c) 
30 

>>> c*+=a 
>>> print(c) 
300 

>>> c/=a 
>>> print(c) 
30.0 

>>> c%=a 
>>> print(c) 
0.0 

>>> c=a**5 
>>> print(c) 
100000 
>>> co//=b 
py print(b) 
20 

>>> print(c) 
5000 


2.6.5 ”位 运算 符 


位 运算 符 是 把 数字 看 作 二 进 制 进行 计算 的 。 表 2-4 为 Python 中 位 运算 的 描述 和 实例 。 假 
设 变量 a 为 60， 变 量 b 为 13。 











表 2-4 “位 运算 符 
运算 符 描述 实例 
。 | 护 位 与 运算 待 : 荐 参与 运算 的 两 个 值 的 两 个 相应 位 者 为 1，| (a & b 输出 结果 12， 二 进 制 解 区， 
则 该 位 的 结果 为 1， 否则 为 0 0000 1100 
按 位 或 运算 符 ， 只 要 对 应 的 两 个 二 进 制 位 有 一 个 为 1， 结 | (a | b 输出 结果 61， 二 进 制 解释 : 
果 位 就 为 1 0011 1101 
“| 按 位 办 或 运 算 符 ， 当 两 个 对 应 的 一 迹 制 位 相 异 时 ， 结 果 为 1 | m | oil 人 





按 位 取 反 运 算 符 : 对 数据 的 每 个 二 进 制 位 取 反 , 即 把 1 变 | Ca ) 输出 结果 -61， 一 进 制 解释， 

~ 为 0, 把 0 变 为 1 1100 0011, 在 一 个 有 符号 二 进 制 数 的 
补 码 形式 

无 移动 运算 符 ， 运 算数 的 各 个 一 进 制 位 全 部 左 移 若干 位 ，| a<<2 输出 结果 240， 一 进 制 解释 : 

由 << 右 边 的 数 指定 移动 的 位 数 ， 高 位 丢弃 ， 低 位 补 0 | 1111 0000 





<< 
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( 续 表 ) 
运算 符 描述 实例 





右 移 动 运算 符 :把 >> 左 边 运 算数 的 各 个 二 进 制 位 全 部 右 移 | a >> 2 输出 结果 15， 二 进 制 解释 : 
若干 位 ，>> 右 边 的 运算 数 指定 移动 的 位 数 0000 1111 





下 面 进 行 实战 。 
>>> a=60 
>>>b=13 
>>> c=0 
>>> c=a&b 
>>> print(c) 
12 

>>> c=alb 
>>> print(c) 
61 

>>> c=a^b 
>>> print(c) 
49 

>>> c=~a 
>>> print(c) 
-61 

>>> c=a<<2 
>>> print(c) 
240 

>>> c=a>>2 
>>> print(c) 
15 


2.6.6 ”逻辑 运算 符 
Python 语言 支持 逻辑 运算 符 。 表 2-5 为 逻辑 运算 符 的 描述 和 实例 ， 假 设 变量 a 为 10， 变 
量 b 为 20。 
表 2-5 ”逻辑 运算 符 


运算 符 | 逻辑 表达 式 描述 实例 
布尔 “与 ” 如 果 x 为 False，x and y 就 返回 False; 否 























and xandy 则 返回 y 的 计算 值 (aandb) 返回 20 
布尔 “或 ”> 如 果 x 是 非 0， 就 返回 x 的 值 ， 否 则 返回 ， 

or xory y 的 计算 什 | (aorb) 返回 10 

not not x 和 not(a and b) 返 回 False 


False， 就 返回 True 
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下 面 进 行 实战 。 
>>> a=10 
>>> b=20 
>>>aandb 
20 
>>>aorb 

10 

>>> nota 
False 
>>>notb 
False 

>>> not -1 
False 

>>> not False 
True 

>>> not True 


False 
2.6.7 ”成 员 运算 符 
除了 之 前 介绍 的 运算 符 外 , Python 还 支持 成 员 运 算 符 , 表 2-6 为 成 员 运算 符 的 描述 和 实例 。 
表 2-6 ”成 员 运 算 符 


运算 符 描述 实例 


四 如 果 在 指定 的 序列 中 找到 值 ， 就 返回 True: 否 | x 在 y 序列 中 , 如 果 x 在 y 序列 中 ,就 返回 Tme 
则 返回 False 


放 如 果 在 指定 的 序列 中 没有 找到 值 ,就 返回 True; | x 不 在 y 序列 中 ， 如 果 x 不 在 y 序列 中 ， 就 返 
人 否则 返回 False 回 Tme 


下 面 进行 实战 。 
>>> a=10 
>>>b=5 
>>> list=[1,2,3,4,5] 
>>> print(a in list) 











False 

>>> print(a not in list) 
True 

>>> print(b in list) 
True 

>>> print(b not in list) 
False 
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你 可 能 会 疑惑 list 是 什么 ，list 是 一 个 集合 ， 此 处 不 做 具体 讲解 ， 后 面 章 节 会 有 详细 介绍 。 
2.6.8 身份 运算 符 
身份 运算 符 用 于 比较 两 个 对 象 的 存储 单元 ， 表 2-7 为 身份 运算 符 的 描述 和 实例 。 


























表 2-7 身份 运算 符 
运算 符 描述 实例 
is is 判断 两 个 标识 符 是 否 引用 自 一 个 对 象 Xisy， 如 果 id(x) 等 于 id(y)，is 返回 结果 1 
is not | is not 用 于 判断 两 个 标识 符 是 否 引用 自 不 同 对 象 Ee ” en 








下 面 进行 实战 。 
>>> a=10 
>>>b=10 
>>> print(a is b) 
True 
>>> print(a is not b) 
False 
>>> b=20 
>>> print(a is b) 
False 
>>> print(a is not b) 
True 





后 面 已 对 变量 b 重新 赋值 ， 因 而 输出 结果 与 前 面 不 太一 致 。 


注 意 
2.6.9 运算 符 优 先 级 
表 2-8 列 出 了 从 最 高 到 最 低 优先 级 的 所 有 运算 符 。 
表 2-8 ”运算 符 优 先 级 


























运算 符 描述 
指数 (最 高 优先 级 ) 
~+- 按 位 翻转 ， 一 元 加 号 和 减 号 (最 后 两 个 的 方法 名 为 +@ 和 -@) 
*/%// 乘 、 除 、 取 模 和 取 整 除 
+- 加 法 、 减 法 
><< 右 移 左 移 运算 符 
& 位 AND 
图 | 位 运算 符 
< 生 <> 盖 比较 运算 符 
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( 续 表 ) 
运算 符 描述 
> 一 上 = 等 于 运算 符 
= 赋值 运算 符 
is is not 身份 运算 符 
in not in 成 员 运 算 符 
not or and 逻辑 运算 符 





当 一 个 表达 式 中 出 现 多 个 操作 符 时 ， 求 值 的 顺序 依赖 于 优先 级 规则 。Python 遵守 数学 操 


作 符 的 传统 规则 。 


小 萌 ， 还 记得 数学 里 面 操 作 符 的 传统 规则 是 怎样 的 吗 ? 

恩 ， 有 括号 先 算 括 号 里 的 ,无论 是 括号 里 还 是 括号 外 的 ， 都 是 先 乘除 、 后 加 减 。 在 Python 
中 有 更 多 操作 运算 符 ， 可 以 使 用 缩 略 词 PEMDAS 帮助 记忆 部 分 规则 。 

(1) 括号 (Parentheses，P) 拥有 最 高 优先 级 ， 可 以 强制 表达 式 按照 需要 的 顺序 求 值 ， 括 
号 中 的 表达 式 会 优先 执行 ， 也 可 以 利用 括号 使 得 表达 式 更 加 易 读 。 

例如 ， 对 于 一 个 表达 式 ， 想 要 执行 完 加 减 后 再 做 乘除 运算 ， 交 互 模式 输入 如 下 : 


>>> a=20 

>>> b=15 

>>> c=10 

>>> d=5 

>>> e=0 

>>> e=(a-b)*c/d 


>>> print('(a-b)*c/d=",e) 


(a-b)*c/d= 10.0 


顺利 达到 了 我 们 想 要 的 结果 ， 如 果 不 加 括 


>>> e=a-b*c/d 


>>> print('a-b*c/d=',e) 


a-b*c/d= -10.0 





样 呢 ? 


结果 与 前 面 完全 不 同 了 ， 这 里 根据 先 乘除 后 加 减 进行 运算 。 如 果 表 达 式 比较 长 ， 加 上 括 


号 就 可 以 使 得 表达 式 更 易 读 。 


>>> e=atbtc-c*+d 


>>> print(atbtc-c*d=",e) 


atbtc-c*d= -5 


以 上 输入 没有 加 括号 ， 表 达 式 本 身 没有 问题 ， 但 看 起 来 不 太 直观 。 如 果 进 行 如 下 输入 : 


>>> e=(atbtc)-(c*d) 


>>> print((at+bt+c)-(c*d)=",e) 


(atbte)-(c*d)= -5 
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这 样 看 起 来 就 非常 直观 。 运 算 结果 还 是 一 样 的 ， 但 我 们 一 看 就 能 明白 该 表达 式 的 执行 顺 
(2) 乘 方 (Exponentiation，E) 操作 拥有 次 高 的 优先 级 ， 例 如 : 
>>> 2**142 

4 

>>> 2**(1+2) 

8 

>>> 2**2I*3 

12 

>>> 2+2#*#3 

16 

>>> 2**(2*3) 

64 


以 上 结果 解释 : 2 的 一 次 方 为 1， 加 2 后 结果 为 4; 1 加 2 等 于 3，2 的 3 次 方 结果 为 8; 2 
的 2 次 方 为 4，4 乘 以 3 等 于 12; 2 的 3 次 方 为 8，2 乘 以 8 等 于 16; 2 乘 以 3 等 于 6，2 的 6 
次 方 为 64。 

(3) 乘法 (Multiplication，M) 和 除法 (Division"，D) 优先 级 相同 ， 并 且 高 于 有 相同 优 
先 级 的 加 法 〈Addition，A) 和 减法 (Subtraction，S) ， 例 如 ; 

>>> atb*c-d 

165 

>>> a*b/ctd 

35.0 


(4) 优先 级 相同 的 操作 按照 自 左 向 右 的 顺序 求 值 ( 除 了 乘 方 外 〉， 例 如 : 
>>> atb-ctd 
30 
>>> atb-c-d 
20 
其 他 运算 符 的 优先 级 在 实际 使 用 时 可 以 自行 尝试 判断 。 若 通过 观察 判断 不 了 ， 则 可 以 在 
交互 模式 下 通过 实验 进行 判断 。 


2.7 ”字符 串 操 作 


字符 串 是 Python 中 最 常用 的 数据 类 型 。 我 们 可 以 使 用 引号 (或 ") 创建 字符 串 。 
通常 字符 串 不 能 进行 数学 操作 ， 即 使 看 起 来 像 数 字 也 不 行 。 字 符 串 不 能 进行 除法 、 减 法 
和 字符 串 之 间 的 乘法 运算 。 下 面 的 操作 都 是 非法 的 。 
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>>> 'hello/3 
Traceback (most recent call last): 
File "<pyshell#83>", line 1, in <module> 
‘hello/3 
TypeError: unsupported operand type(s) for /: str and 'int 
>>> 'world'-1 
Traceback (most recent call last): 
File "<pyshell#84>", line 1, in <module> 
‘world'-1 
TypeError: unsupported operand type(s) for -: 'str' and 'int 
>>> "hello*world 
Traceback (most recent call last): 
File "<pyshell#85>", line 1, in <module> 
hello*world 
NameError: name 'world is not defined 
>>> 'hello'-'world' 
Traceback (most recent call last): 
File "<pyshell#86>", line 1, in <module> 
‘hello'-'world’ 


TypeError: unsupported operand type(s) for -: 'str' and 'str 


字符 串 可 以 使 用 操作 符 +， 但 功能 和 数学 中 不 一 样 ， 它 会 进行 拼接 (concatenation) 操作 ， 
即将 前 后 两 个 字符 首尾 连接 起 来 。 

例如 : 

>>> Stringl='hello' 

>>> string2="world' 

>>> print(stringl+string2) 

helloworld 

输出 的 字符 紧 紧 挨 着 ， 看 起 来 不 怎么 好 看 ， 能 不 能 在 两 个 单词 间 加 一 个 空格 呢 ? 

如 果 想 让 字符 串 之 间 有 空格 ， 就 可 以 建 一 个 空 字符 变量 插 在 相应 的 字符 串 之 间 ， 让 字符 
串 隔 开 ， 或 者 在 字符 串 中 加 入 相应 的 空格 。 交 互 模式 下 输入 如 下 : 

>>> stringl='hello' 

>>> string2="world' 

>>> space="" 

>>> print(stringl+spacetstring2) 

hello world 


或 者 


>>> stringl='hello' 
>>> string2=" world' 
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>>> print(stringl+string2) 
hello world 


这 些 是 字符 串 的 一 些 简单 操作 ， 在 后 续 章节 中 会 介绍 更 多 、 更 实用 的 字符 串 操作 。 

小 萌 ， 你 有 没有 发 现 进行 了 这 么 多 操作 ， 操 作 中 都 没有 出 现 中 文 ， 这 是 怎么 回 事 呢 ? 

是 啊 ， 虽 说 一 直 用 英文 操作 ， 在 编码 时 可 以 学 习 英 文 ， 但 很 多 时 候 我 还 是 喜欢 用 中 文 表 
达 。 我 们 目前 没有 操作 中 文 ， 是 因为 Python 不 支持 中 文 吗 ? 

Python 是 支持 中 文 的 。 正 如 我 们 前 面 所 说 ， 字 符 串 也 是 一 种 数据 类 型 ， 但 是 字符 串 特殊 
的 是 有 编码 问题 。 

因为 计算 机 只 能 处 理 数字 ， 其 实 只 认识 0 和 1， 即 二 进 制 。 如 果 要 处 理 文本 ， 就 必须 先 把 
文本 转换 为 数字 才能 处 理 。 最 早 的 计算 机 在 设计 时 采用 8 比特 (bit) 为 一 个 字 节 (byte) ， 所 
以 一 个 字 节 (8 位 ) 能 表示 的 最 大 整数 是 2355 (二进制 11111111 等 于 十 进 制 255， 简 单 表示 为 
2**8-1=255) 。 如 果 要 表示 更 大 的 整数 ， 就 必须 用 更 多 字 节 。 比 如 两 个 字 节 (16 位 ) 可 以 表 
示 的 最 大 整数 是 65535 (2**16-1) ，4 个 字 节 (32 位 ) 可 以 表示 的 最 大 整数 是 4294967295 
(2*##32-1) 。 

由 于 计算 机 是 美国 人 发 明 的 ， 因 此 最 早 只 有 127 个 字母 被 编码 到 计算 机 里 ， 也 就 是 大 小 
写 英文 字母 、 数 字 和 一 些 符号 ， 这 个 编码 表 被 称 为 ASCII 编码 。 例 如 ， 大 写字 母 A 的 编码 是 
65， 小 写字 母 z 的 编码 是 122。 

要 处 理 中 文 ， 显 然 一 个 字 节 是 不 够 的 ， 至 少 需要 两 个 字 节 ， 而 且 不 能 和 ASCII 编码 冲突 ， 
所 以 中 国 制定 了 GB2312 编码 ， 用 来 把 中 文 编 进 去 。 

可 以 想象 ， 全 世界 有 上 百 种 语言 ， 日 本 把 日 文 编 到 Shift_ JIS 里 ， 韩 国 把 韩文 编 到 Euc-kr 
里 , 各 国有 各 国 的 标准 ,就 不 可 避免 地 出 现 冲 突 。 结 果 就 是 ， 在 多 语言 混合 的 文本 中 就 会 显示 
乱码 。 当 时 各 国 对 编码 问题 的 感觉 如 图 2-7 所 示 。 












































| 


守 符 编码 的 问题 真是 令 人 头 次 、 





2-7 令 人 头疼 的 字符 编码 


Unicode 应 运 而 生 。Unicode 把 所 有 语言 都 统一 到 一 套 编码 里 ,这样 就 不 会 有 乱码 问题 了 。 

Unicode 标准 在 不 断 发 展 ， 最 常用 的 是 用 两 个 字 节 表示 一 个 字符 (如 果 要 用 到 非常 偏僻 的 
字符 ， 就 需要 4 个 字 节 ) 。 现 代 操 作 系 统 和 大 多 数 编 程 语言 都 直接 支持 Unicode。 

下 面 我 们 来 看 ASCII 编码 和 Unicode 编码 的 区 别 : ASCII 编码 是 1 个 字 节 ， 而 Unicode 编 
码 通常 是 两 个 字 节 。 

字母 A 用 ASCII 编码 是 十 进 制 的 65， 二 进 制 的 01000001 。 

字符 0 用 ASCII 编码 是 十 进 制 的 48, 二 进 制 的 00110000。 注意 字符 0 和 整数 0 是 不 同 的 。 

汉字 “中 ”已 经 超出 了 ASCII 编码 的 范围 ， 用 Unicode 编码 是 十 进 制 的 20013， 二 进 制 的 
01001110 00101101。 
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如 果 把 ASCII 编码 的 A 用 Unicode 编码 ， 只 需要 在 前 面 补 0 就 可 以 ， 因 此 A 的 Unicode 
编码 是 00000000 01000001。 

新 的 问题 又 出 现 了 : 如 果 统 一 成 Unicode 编码 ,乱码 问 题 从 此 消失 了 。 但 是 写 的 文本 基本 
上 全 部 是 英文 时 ,用 Unicode 编码 比 ASCII 编码 多 一 倍 存储 空间 , 在 存储 和 传输 上 十 分 不 划算 。 

本 着 节约 的 精神 ， 又 出 现 了 把 Unicode 编码 转化 为 “可 变 长 编码 ”的 UTF-8 编码 。UTF-8 
编码 把 一 个 Unicode 字符 根据 不 同 的 数字 大 小 编码 成 1 一 6 个 字 节 ， 常 用 的 英文 字母 被 编码 成 
1 个 字 节 ， 汉 字 通 常 是 3 个 字 节 ， 只 有 很 生僻 的 字符 才 会 被 编码 成 4~6 个 字 节 。 如 果 你 要 传 
输 的 文本 包含 大 量 英文 字符 ， 用 UTF-8 编码 就 能 节省 空间 ， 如 表 2-9 所 示 。 


表 2-9 各 种 编码 方式 比较 





UTF-8 
01000001 00000000 01000001 01000001 
这 01001110 00101101 11100100 10111000 10101101 


从 表 2-9 可 以 发 现 , UTF-8 编 码 有 一 个 额外 的 好 处 ,就 是 ASCII 编 码 实际 上 可 以 看 成 是 UTF-8 
编码 的 一 部 分 ， 所 以 只 支持 ASCII 编码 的 大 量 历史 遗留 软件 可 以 在 UTF-8 编码 下 继续 工作 。 

搞 清楚 ASCII、Unicode 和 UTF-8 的 关系 后 ,我们 可 以 总 结 一 下 现在 计算 机 系统 通用 的 字 
符 编 码 工作 方式 : 在 计算 机 内 存 中 , 统一 使 用 Unicode 编码 , 当 需 要 保存 到 硬盘 或 需要 传输 时 ， 
可 以 转换 为 UTF-8 编码 。 

例如 ， 用 记事 本 编辑 时 ， 从 文件 读 取 的 UTF-8 字符 被 转换 为 Unicode 字符 到 内 存 ， 编 辑 
完成 后 ， 保 存 时 再 把 Unicode 转换 为 UTF-8 保存 到 文件 ， 如 图 2-8 所 示 。 

浏览 网 页 时 ， 服 务 器 会 把 动态 生成 的 Unicode 内 容 转 换 为 UTF-8 再 传输 到 浏览 器 ， 如 图 
2-9 所 示 。 











记事 本 服务 器 
Unicode 编 码 


Unicode 编 码 
eA 输出 UTF-8 网 页 


文件 : abc.txt 
UTF-8 编 码 浏览 器 


图 2-8 字符 转换 图 2-9 服务 器 、 浏 览 器 中 的 字符 串 转换 


我 们 经 常 看 到 很 多 网 页 的 源码 上 有 类 似 <meta charset="UTF-8" 户 的 信息 , 表示 该 网 页 用 的 
UTF-8 编码 。 

在 最 新 的 Python 3 版 本 中 ， 字 符 串 是 以 UTF-8 编码 的 。 也 就 是 说 ，Python 3 的 字符 串 支 
持 多 语言 。 比 如 在 交互 模式 下 输入 : 
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>>> print( 你 好 ， 世 界 ! ) 
你 好 ， 世界! 

>>> print( 俩 甬 ) 

全 稻 


可 以 看 到 ， 在 Python 3 中 ， 简 单 和 复杂 的 中 文字 符 都 可 以 正确 输出 。 


Python 2 中 默认 的 编码 格式 是 ASCIL, 在 没 修改 编码 格式 时 无 法 正确 输出 中 文 , 在 读 取 中 
注 意 文 时 会 报错 。Python 2 使 用 中 文 的 语法 是 在 字符 囊 前 面 加 上 前 级 u。 


2.8 注 释 


当 程 序 变 得 更 大 、 更 复杂 时 ， 读 起 来 也 更 困难 。 程 序 的 各 部 分 之 间 紧 密 衔接 ， 想 依靠 部 
分 代码 了 解 整个 程序 的 功能 很 困难 。 在 现实 中 , 我 们 经 常 很 难 弄 清楚 一 段 代码 在 做 什么 、 为 什 
么 那么 做 。 

因此 ， 在 程序 中 加 入 自然 语言 的 笔记 解释 程序 在 做 什么 是 一 个 不 错 的 主意 。 这 种 笔记 称 
为 注释 (comments) ， 注 释 必 须 以 “#” 符 号 开始 。 

注释 可 以 单独 占 一 行 ， 也 可 以 放 在 语句 行 的 末尾 。 在 交互 模式 下 输入 如 下 : 

>>># 打印 1+1 的 结果 

>>> print(1+1) 

沁 

>>> print(1+1)# 打印 1+1 的 结果 

2 


从 符号 “#” 开 始 到 这 一 行 末尾 ， 之 间 所 有 内 容 都 被 忽略 ， 这 部 分 对 程序 没有 影响 。 注 释 
信息 主要 是 方便 程序 员 , 一 个 新 来 的 程序 员 通 过 注释 信息 能 够 更 快 地 了 解 程序 的 功能 。 程序 员 
在 经 过 一 段 时 间 后 ， 可 能 对 自己 的 程序 不 了 解 了 ， 利 用 注释 信息 能 够 很 快 熟悉 起 来 。 

注释 最 重要 的 用 途 在 于 解释 代码 并 不 显而易见 的 特性 。 比 如 ， 在 以 下 代码 中 ， 注 释 与 代 
码 重复 ， 毫 无 用 处 。 

>>>F=10 。 # 将 10 赋值 给 r 

下 面 这 段 代码 注释 包含 代码 中 隐藏 的 信息 ， 如 果 不 加 注释 ， 就 很 难 让 人 看 懂 是 什么 意思 
〈 虽 然 在 实际 中 可 以 根据 上 下 文 判 定 ， 但 是 需要 浪费 不 必要 的 思考 时 间 ) 。 

>>> 王 10 # 半 径 ， 单 位 是 米 

选择 好 的 变量 名 可 以 减少 注释 ， 但 长 名 字 会 让 复杂 表达 式 更 难 阅读 ， 所 以 这 两 者 之 间 需 
要 权衡 取舍 。 
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2.9 调 试 


这 里 通过 设置 的 一 些 错误 让 读者 认识 在 编写 代码 过 程 中 的 常见 问题 ， 以 帮助 读者 熟悉 和 
解决 实际 遇 到 的 问题 。 

(1) 还 记得 数字 类 型 转换 吗 ? 用 int0 转 换 一 个 字符 ， 会 得 到 怎样 的 结果 呢 ? 尝试 一 下 ， 
在 交互 模式 下 输入 : 

>>> int(hello) 

Traceback (most recent call last): 

File "<pyshell#136>", line 1, in <module> 

int('hello') 

ValueError: invalid literal for int() with base 10: "hello' 

开动 大 脑 ， 思 考 一 下 这 段 语句 的 功能 。 

(2) 在 变量 和 关键 字 中 ， 若 变量 被 命名 为 关键 字 会 怎样 呢 ? 输入 如 下 

>>> class=' 你 好 ' 

SyntaxError invalid syntax 

(3) 在 算术 运算 符 中 ， 若 被 除数 为 0， 结 果 会 怎样 呢 ? 输入 如 下 


>>> 9/0 
Traceback (most recent call last): 
File "<pyshell#144>", line 1, in <module> 
9/0 
ZeroDivisionError: division by zero 


这 里 的 被 除数 跟 数 学 中 的 一 样 ， 不 能 为 0。 
2.10 ”问题 解答 


(1) 关键 字 那 么 多 ， 我 需要 全 部 记 住 吗 ? 

答 : 可 以 不 用 刻意 记忆 ， 随 着 你 逐步 学 习 ， 会 碰 到 一 些 常用 关键 字 ， 见 多 了 自然 就 熟悉 
了 。 对 于 一 些 不 常用 的 ， 见 到 了 再 回头 看 是 否 属于 关键 字 。 总 之 ， 关 键 字 可 以 在 学 习 和 使 用 中 
慢 慢 记 忆 。 

(2) 这 么 多 运算 符 ， 都 需要 熟练 使 用 吗 ? 

答 : 能 熟练 使 用 当然 最 好 ， 若 不 能 全 部 熟练 使 用 ， 也 要 有 所 了 解 ， 在 实际 解决 问题 时 知 
道 应 该 使 用 什么 运算 符 。 当 然 ， 也 可 以 碰 到 具体 问题 时 再 详细 研究 。 
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(3) 字符 串 的 操作 只 有 本 章 介绍 的 这 些 吗 ? 


答 : 字符 串 还 有 很 多 操作 ， 本 章 介绍 的 只 是 一 些 入 门 操作 ， 后 面 的 章节 会 详细 介绍 。 


| 
2 
三 
4 
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2.11 温 故 知 新 ， 学 以 致 用 


. 回顾 数据 类 型 相关 的 概念 ， 如 整 型 、 浮 点 型 和 数据 类 型 转换 。 

. 回顾 变量 和 关键 字 相关 的 概念 ， 并 尝试 记 住 这 些 关 键 字 。 

回顾 运算 符 和 操作 对 象 ， 并 通过 不 断 调试 熟悉 各 种 运算 符 。 

. 回顾 字符 串 的 操作 及 注释 ， 了 解 编码 方式 ， 尝 试 写 注释 。 

. 小 萌 和 小 智 约定 ， 明 天 小 智 送 一 颗 糖 给 小 靖 ， 并 从 后 天 起 ， 小 智 每 天 比 前 一 天 多 送 一 





倍 的 糖 给 小 靖 ， 到 第 16 天 (包含 这 天 ) ， 小 萌 一 共 可 以 收 到 多 少 颗 糖 ? 


6. 用 4 个 2 与 各 种 运算 符 进 行 运算 ， 得 到 的 最 大 数 是 多 少 ? 

7. 结合 本 章 所 学 , 并 查阅 相关 资料 , 看 看 下 面 的 代码 输出 结果 是 什么 , 并 对 结果 进行 解释 。 
>>> habit='Python 是 一 门 很 有 用 的 编程 语言 m 我 想 学 好 它 ' 

>>> print(habit) 

# 你 认为 的 结果 是 

>>> len(habit) 

# 你 认为 的 结果 是 





列表 和 元 组 


本 章 将 引入 一 个 新 概念 一 一 数据 结构 。 数 据 结构 是 通过 
某 种 方式 (如 对 元 素 进 行 编号 ) 组 织 在 一 起 的 数据 元 素 的 集 
合 ， 这 些 元 素 可 以 是 数字 或 字符 。 在 Python 中 ， 最 基本 的 
数据 结构 是 序列 〈Sequence) 。Python 包含 6 种 内 建 序列 ， 
即 列表 、 元 组 、 字 符 串 、Unicode 字符 串 、buffer 对 象 和 xrange 
对 象 。 本 章 重 点 讨论 最 常用 的 两 种 ， 即 列表 和 元 组 。 





ww A 
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3.1 通用 序列 操作 





在 讲解 列表 和 元 组 之 前 ， 本 节 先 介绍 Python 中 序列 的 通用 操作 ， 这 些 操作 在 列表 和 元 组 
中 都 会 用 到 。 

Python 中 所 有 序列 都 可 以 进行 一 些 特定 操作 ， 包 括 索 引 (indexing) 、 分 片 〈slicing) 、 
序列 相 加 (adding) 、 乘 法 Cmultiplying) 、 成 员 资格 、 长 度 、 最 小 值 和 最 大 值 。 


3 小 1 索引 


序列 是 Python 中 最 基本 的 数据 结构 。 序 列 中 的 每 个 元 素 都 分 配 一 个 数字 ， 代 表 它 在 序列 
中 的 位 置 (索引 ) ， 第 一 个 索引 是 0， 第 二 个 索引 是 1， 以 此 类 推 。 

序列 中 所 有 元 素 都 是 有 编号 的 ， 从 0 开始 递增 。 可 以 通过 编号 分 别 对 序列 的 元 素 进 行 访 
问 。 下 面 通过 交互 输入 方式 介绍 一 个 通过 编号 取 元 素 的 例子 。 

>>> greeting='Hello# 定 义 变量 greeting， 并 赋值 Hello 

>>> greeting[0] # 根 据 编号 取 元 素 ， 使 用 格式 为 :在 中 括号 中 输入 所 取 元 素 的 编号 值 

'H' 

>>> greeting[1] 

四 

>>> greeting[2] 

由 

可 以 看 到 ， 序 列 中 的 元 素 从 0 开始， 从 左 向 右 依 自然 顺序 编号 ， 元 素 可 以 通过 编号 访问 。 获 
取 元 素 的 方式 为 ， 在 变量 后 加 中 括号 ， 在 中 括号 中 输入 所 取 元 素 的 编号 值 。 这 个 格式 需要 记 住 。 

类 似 于 我 们 平时 排队 ， 站 成 一 排 时， 一 般 从 左 往 右 编号 ， 编 上 序号 后 〈 一 般 从 1 开始 编 
号 ， 不 会 从 0 开始) ， 当 叫 一 个 序号 时 ， 就 会 由 序号 对 应 到 人 。 程 序 中 的 序列 也 是 如 此 。 

这 里 的 编号 就 是 索引 ， 可 以 通过 索引 获取 元 素 。 所 有 序列 都 可 以 通过 这 种 方式 进行 索引 。 





字符 串 是 由 字符 组 成 的 序列 。 索 引 0 指向 第 一 个 元 素 。 比 如 在 上 面 的 示例 中 ， 索 引 0 指 
注意 向 字母 H， 索引 1 指向 字母 e， 索 引 2 指向 字母 1。 


上 面 的 示例 是 从 左 往 右 通过 编号 获取 元 素 的 ， 是 否 可 以 从 右 往 左 通过 编号 获取 元 素 呢 ? 
我 们 试 一 试 ， 在 交互 模式 下 输入 : 

>>> greeting[-1] 

>>> greeting[-2] 

由 

>>> greeting[-3] 

由 
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>>> greeting[-4] 

四 

可 以 看 到 , Python 的 序列 也 可 以 从 右 开始 索引 , 最 右边 的 元 素 索 引 值 为 -1, 从 右 向 左 递减 。 

在 Python 中 ， 从 左 向 右 索 引 称 为 正 数 索引 ， 从 右 向 左 索引 称 为 负数 索引 。 使 用 负数 索引 
时 ，Python 会 从 最 后 一 个 元 素 开始 计数 。 最 后 一 个 元 素 的 位 置 编号 是 -1。 


0 最 后 一 个 元 素 的 编号 不 是 -0， 跟 数学 中 的 概念 一 样 ，-0=0、-0 和 0 都 指向 第 一 个 元 素 。 
注意 

从 上 面 的 几 个 示例 可 以 看 到 ， 进 行 字符 串 的 索引 时 都 定义 了 一 个 变量 ， 其 实 不 定义 变量 
也 可 以 。 下 面 来 看 一 个 例子 ， 在 交互 模式 输入 : 

>>> 'Hello'[0] 

'H' 

>>> 'Hello'[1] 

ie 

>>> 'Hello'[-1] 

四 

>>> 'Hello'[-2] 

由 

可 以 看 到 ， 直 接 使 用 索引 ， 不 定义 变量 进行 引用 也 可 以 。 直 接 使 用 索引 的 效果 和 定义 变 
量 的 效果 是 一 样 的 。 

如 果 函 数 返 回 一 个 序列 ， 是 否 可 以 直接 对 结果 进行 索引 操作 呢 ? 在 交互 模式 下 输入 : 

>>> thirdth=inputO[0] 

happy 

>>> thirdth 

册 

由 输出 结果 可 以 看 到 ， 直 接 对 函数 的 返回 结果 进行 了 索引 操作 。 

索引 既 可 以 对 变量 的 引用 操作 ， 也 可 以 直接 操作 序列 ， 还 可 以 操作 函数 的 返回 序列 。 


3.1.2 分 片 


索引 用 来 对 单个 元 素 进行 访问 ， 使 用 分 片 可 以 对 一 定 范围 内 的 元 素 进行 访问 ， 分 片 通过 
冒号 相隔 的 两 个 索引 实现 。 在 交互 模式 输入 : 


>>> number=[1,2,3,4,5,6,7,8,9,10] 

>>> number[1:3] # 取 索引 为 第 一 和 第 二 的 元 素 

[2,3] 

>>> number[-3:-1] ”# 负 数 表 明 从 右 开 始 计 数 ， 取 得 倒数 第 三 和 倒数 第 二 的 元 素 
[8, 9] 
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由 操作 结果 可 以 看 到 ， 分 片 操作 既 支 持 正 数 索 引 ， 也 支持 负数 索引 ， 并 且 对 于 提取 序列 
的 一 部 分 很 方便 。 

分 片 操作 的 实现 需要 提供 两 个 索引 作为 边界 ， 第 一 个 索引 的 元 素 包 含 在 分 片 内 ， 第 二 个 
索引 的 元 素 不 包含 在 分 片 内 。 像 数学 里 的 a 万 x 二 b，x 是 我 们 需要 得 到 的 元 素 ，a 是 分 片 操作 
中 的 第 一 个 索引 ，b 是 第 二 个 索引 ，b 不 包含 在 x 的 范围 内 。 

对 于 上 面 的 示例 ， 假 设 需要 访问 最 后 3 个 元 素 ， 使 用 正 数 索 引 可 以 这 样 操作 : 

>>> number=[1,2,3,4,5,6,7,8,9,10] 

>>> number[7:10] # 取 最 后 3 个 元 素 

[8, 9, 10] 


由 以 上 输入 和 我 们 前 面 对 序 列 的 定义 可 以 得 出 ，number 的 编号 最 大 应 该 为 9， 编号 为 10 
指向 的 是 第 11 个 元 素 ， 是 一 个 不 存在 的 元 素 ， 但 是 由 于 在 最 后 一 个 元 素 之 后 ， 因 此 能 得 到 最 
后 一 个 元 素 。 这 么 做 没 问题 。 如 果 需 要 从 列表 的 结尾 开始 ， 即 使 用 负数 索引 ， 怎 么 办 呢 ? 我 们 
尝试 看 看 ， 输 入 如 下 : 

>>> number=[1,2,3,4,5,6,7,8,9,10] 

>>> number[-3,-1] 

[8, 9] 


结果 没有 输出 最 后 一 个 元 素 。 再 试 试 使 用 索引 0 作为 最 后 一 个 元 素 的 下 一 个 元 素 ， 输 入 
如 下 : 

>>> number[-3:0] 

0 

这 个 输出 结果 有 点 奇怪 ， 竞 然 一 个 数值 都 没有 。 
事实 上 ， 只 要 在 分 片 中 最 左边 的 索引 比 它 右 边 的 索引 晚 出 现在 序列 中 ， 结 果 就 是 一 个 空 
序列 。 比 如 上 例 中 ，-3 代表 倒数 第 3 个 元 素 ，0 代表 第 一 个 元 素 , 倒数 第 3 个 元 素 比 第 一 个 元 
素 晚 出 现 ， 即 排 在 第 一 个 元 素 后 面 ， 所 以 得 到 的 结果 是 空 序列 。 

我 们 怎么 通过 负数 索引 的 方式 取得 最 后 一 个 元 素 呢 ? 这 里 有 一 个 捷径 可 以 使 用 。 如 果 需 
要 取得 的 分 片 包括 序列 结尾 的 元 素 ， 只 需 将 第 二 个 索引 设置 为 空 即 可 。 输 入 如 下 : 

>>> number[-3:] 

[8, 9, 10] 


输出 结果 和 我 们 预期 的 一 样 。 
正 数 索引 能 否 使 用 这 种 方式 呢 ? 输入 如 下 : 


>>> number[0:] # 从 第 一 个 元 素 开始 输出 ， 输 出 全 部 结果 
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10] 

>>> number[:0] # 最 后 一 个 元 素 为 第 一 个 ， 输 出 为 空 

0 

>>> number[:3] # 取 得 前 3 个 元 素 

[1,2,3] 
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由 输出 结果 可 以 知道 也 适用 于 正 数 索引 。 
根据 上 述 输出 结果 可 知 ， 若 需要 输出 整个 序列 ， 则 可 以 将 两 个 索引 都 设置 为 空 。 输 入 如 下 


>>> number[:] # 取 得 整个 数组 
| 


输出 结果 是 整个 序列 。 

进行 分 片 时 ， 分 片 的 开始 和 结束 点 都 需要 指定 (无论 是 直接 还 是 间接 ) ， 用 这 种 方式 取 
连续 的 元 素 没有 问题 , 但 若 要 取 序 列 中 不 连续 的 元 素 就 比较 麻烦 , 或 者 直接 不 能 操作 。 比 如 要 
取 序列 number 中 的 所 有 奇数 ， 以 一 个 序列 展示 出 来 ， 用 前 面 的 方法 就 不 能 实现 了 。 

对 于 上 面 这 种 情况 ，Python 为 我 们 提供 了 另 一 个 参数 一 一 步 长 (step length) ， 该 参数 通 
常 是 隐 式 设置 的 。 在 普通 分 片 中 , 步 长 是 1。 分 片 操作 就 是 按照 这 个 步 长 逐个 遍历 序列 的 元 素 ， 
遍历 后 返回 开始 和 结束 点 之 间 的 所 有 元 素 。 也 可 以 理解 为 默认 步 长 是 1， 即 没有 设置 步 长 时 ， 
步 长 隐 式 设 置 值 为 1。 输 入 如 下 

>>> number[0:10:1] 

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10] 


由 上 面 的 示例 可 以 看 到 ， 分 片 包含 另 一 个 数字 。 这 种 方式 就 是 步 长 的 显 式 设置 。 看 起 来 
和 隐 式 设置 步 长 没什么 区 别 ， 得 到 结果 和 之 前 也 一 样 。 但 若 将 步 长 设置 为 比 1 大 的 数 ， 结 果 会 
怎样 呢 ? 输入 如 下 

>>> number[0:10:2] 

WS 


由 上 面 的 输出 结果 可 以 看 到 ， 对 于 number 序列 ， 设 置 步 长 为 2 时， 得 到 的 结果 就 是 我 们 
前 面 想 要 的 奇数 序列 。 

由 结果 可 知 ， 步 长 设置 为 大 于 1 的 数 时 ， 会 得 到 一 个 跳 过 某 些 元 素 的 序列 。 例 如 ， 我 们 
上 面 设 置 的 步 长 为 2, 得 到 的 序列 是 从 开始 到 结束 每 隔 1 个 元 素 的 序列 。 比 如 还 可 以 这 样 使 用 : 

>>> number[0:10:3] 

[1, 4, 7, 10] 

>>> number[2:6:3] 

[GB3, 6] 

>>> number[2:5:3] 

D] 

>>> number[1:5:3] 

[2,5] 


由 以 上 输出 可 以 看 到 ， 使 用 步 长 的 方式 还 是 很 灵活 的 。 
除了 上 面 的 使 用 方式 外 ， 设 置 前 面 两 个 索引 为 空 的 捷径 也 可 以 使 用 。 操 作 如 下 : 


>>> number[::3] 
[1,4,7, 10] 
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上 面 的 操作 将 序列 中 每 3 个 元 素 的 第 一 个 提取 出 来 ， 前 面 两 个 索引 都 设置 为 空 。 步 长 设 
置 为 0 是 否 可 行 呢 ? 输入 如 下 : 
>>> number[::0] 
Traceback (most recent call last): 
File "<pyshell#73>", line 1, in <module> 
number[::0] 
ValueError: slice step cannot be zero 


输出 结果 告诉 我 们 步 长 不 能 为 0。 
步 长 是 否 可 以 为 负数 呢 ? 输入 如 下 : 


>>> number[10:0:-2] 

[10, 8, 6, 4, 2] 

>>> number[0:10:-2] 

U0 

>>> number[::-2] 

[10, 8, 6, 4, 2] 

>>> number[5::-2] 

[6, 4, 2] 

>>> number[:5:-2] 

[10, 8] 

>>> number[::-1] 

[10, 9, 8, 7, 6, 5, 4, 3, 2, 1] 

>>> number[10:0:-1] # 第 二 个 索引 为 0， 取 不 到 序列 中 的 第 一 个 元 素 
[10, 9, 8, 7, 6, 5, 4, 3, 2] 

>>> number[10::-1] # 设 置 第 二 个 索引 为 空 ， 可 以 取 到 序列 的 一 个 元 素 
[10, 9, 8, 7, 6, 5, 4, 3, 2, 1] 

>>> number[2::-1] # 设 置 第 二 个 索引 为 空 ， 可 以 取 到 序列 的 一 个 元 素 
[3, 2, 1] 

>>> number[2:0:-1] # 第 二 个 索引 为 0， 取 不 到 序列 中 的 第 一 个 元 素 


上 面 的 输出 结果 好 像 不 太 好 理解 ， 使 用 负数 步 长 时 的 结果 怎么 跟 使 用 正 数 步 长 的 结果 相 
反 呢 ? 这 就 是 正 数 步 长 和 负数 步 长 的 不 同 。 

对 于 正 数 步 长 ，Python 会 从 序列 的 头 部 开始 向 右 提取 元 素 ， 直 到 最 后 一 个 元 素 ， 对 于 负 
数 步 长 ， 则 是 从 序列 的 尾部 开始 向 左 提取 元 素 , 直到 第 一 个 元 素 。 正 数 步 长 必须 让 开始 点 小 于 
结束 点 ， 而 负数 步 长 必须 让 开始 点 大 于 结束 点 。 


(7 eat， 代用 和 妆 攻 时 ， 设 于 第 二 个 家 引 为 袜 能 取 到 皮 列 的 第 一 个 元。 


注意 
3.1.3 ”序列 相 加 
使 用 加 号 可 以 进行 序列 的 连接 操作 ， 输 入 如 下 : 
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>>> [1,2,3]+[4,5,6] 
[1,2,3,4,5, 6] 
>>>a=[12] 

>>> b=[5.6] 

>>> af+b 

[1, 2, 5, 6] 

>>> s='hello,' 

>>> w="'world' 
>>> stw 
'hello,world' 


由 上 面 的 输出 结果 可 以 看 到 ， 数 字 序 列 可 以 和 数字 序列 通过 加 号 连接 ， 连 接 后 的 结果 还 
是 数字 序列 ; 字符 串 序 列 也 可 以 通过 加 号 连接 , 连接 后 的 结果 还 是 字符 串 序列 。 数 字 序列 是 否 
可 以 和 字符 串 序 列 相 加 呢 ? 结果 是 数字 序列 还 是 字符 串 序列 呢 ? 输入 如 下 

>>> [1,2]+'hello' 

Traceback (most recent call last): 

File "<pyshell#103>", line 1, in <module> 
[12]+hello' 

TypeError': can only concatenate list (not "str") to list 

>>> type([1,2]) # 取 得 [1,2] 的 类 型 为 list 

<class 'list> 

>>> type(hello) # 取 得 hello 的 类 型 为 字符 串 


<class 'str'> 


由 上 面 的 输出 结果 可 以 看 到 ， 数 字 序 列 和 字符 串 序列 不 能 通过 加 号 连接 。 错 误 提 示 的 信 
息 是 : 只 能 列表 和 列表 相连 。 

由 试验 结果 可 以 得 知 : 只 有 类 型 相同 的 序列 才能 通过 加 号 进行 序列 连接 操作 ， 不 同类 型 
的 序列 不 能 通过 加 号 进行 序列 连接 操作 。 
3.1.4 乘法 

注意 此 处 的 乘法 并 不 是 数学 中 定义 的 乘法 。 

用 一 个 数字 x 乘 以 一 个 序列 会 生成 新 的 序列 。 在 新 的 序列 中 ， 原 来 的 序列 将 被 重复 x 次 
这 就 是 序列 中 的 乘法 。 在 交互 模式 下 输入 : 

>>> 'hello'*5 

‘hellohellohellohellohello' 

>>> [7]*10 

| i Fy Ey pr Pr Pe ES | 

从 输出 结果 看 到 ， 序 列 被 重复 了 对 应 的 次 数 ， 而 不 是 做 了 数学 中 的 乘法 运算 。 

在 Python 中 ， 序 列 的 乘法 有 什么 特殊 之 处 呢 ? 
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如 果 要 创建 一 个 重复 序列 ， 就 可 以 像 上 面 的 示例 一 样 乘 以 一 个 想 要 得 到 的 序列 长 度 的 数 
字 ， 这 样 可 以 快速 得 到 需要 的 列表 ， 非 常 方便 。 

空 列表 可 以 简单 通过 两 个 中 括号 ([]) 表示 ， 表 示 里 面 什么 东西 都 没有 。 如 果 想 创建 一 个 
占用 10 个 或 更 多 元 素 的 空间 ， 却 不 包括 任何 有 用 内 容 的 列表 ， 该 怎么 办 呢 ? 我 们 可 以 像 上 面 
的 示例 一 样 乘 以 10 或 对 应 的 数字 ， 得 到 需要 的 空 列 表 ， 也 很 方便 。 

如 果 要 初始 化 一 个 长 度 为 x 的 序列 ， 就 需要 让 每 个 编码 位 置 上 都 是 空 值 ， 此 时 需要 一 个 
值 代表 空 值 ， 即 里 面 没 有 任何 元 素 ， 可 以 使 用 None。None 是 Python 的 内 建 值 ， 确 切 含义 是 
“这 里 什么 也 没有 ”。 例 如 ， 输 入 如 下 : 

>>> sq=[None]*5 # 初 始 化 sq 为 含有 5 个 None 的 序列 


>>>sq 





[None, None, None, None, None] 


从 示例 我 们 可 以 看 到 ，Python 中 的 序列 乘法 可 以 帮助 我 们 快速 做 一 些 初始 化 操作 。 序 列 
乘法 做 一 些 重复 操作 、 空 列表 和 None 初始 化 操作 还 是 挺 方便 的 。 


3.1.5 成 员 资 格 


为 了 检查 一 个 值 是 否 在 序列 中 ，Python 为 我 们 提供 了 in 运算 符 。in 运算 符 和 前 面 讨论 过 
的 运算 符 有 些 不 同 。in 运算 符 用 于 检验 某 个 条 件 是 否 为 真 ， 并 返回 检验 结果 ， 检 验 结果 为 真 
返回 True， 结 果 为 假 返回 False。 这 种 运算 符 称 作 布 尔 运算 符 ， 返 回 的 真 值 叫 作 布尔 值 。 关 于 
布尔 运算 符 的 更 多 内 容 会 在 后 续 章 节 中 进行 介绍 。 

下 面 我 们 尝试 使 用 in 在 交互 模式 输入 : 

>>> greeting='hello,world' 

>>>'w' in greeting ”# 检 测 w 是 否 在 字符 串 中 


True 








>>> 'a' in greeting 

False 

>>> users=['xiaomeng’,'xiaozhi','xiaoxiao'] 

>>> 'xiaomeng' in users ”# 检 测字 符 串 是 否 在 字符 串 列表 中 
True 

>>> 'xiaohuai' in users 

False 

>>> numbers=[1,2,3,4,5] 

>>> 1 in numbers # 检 测 数字 是 否 在 数字 列表 中 
True 

>>> 6innumbers 

False 

>>> eng="** Study python is so happy!**" 

>>> *## in eng # 检 测 一 些 特殊 字符 是 否 在 字符 串 中 
True 

>>> 9 ineng 


False 
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>>> 'a in numbers 
False 
>>> 3 in greeting 
Traceback (most recent call last): 
File "<pyshell#123>", line 1, in <module> 
3 in greeting 
TypeError: 'in <string>' requires string as left operand, not int 
由 上 面 的 输出 结果 可 以 看 到 ， 使 用 in 可 以 很 好 地 检测 字符 或 数字 是 否 在 对 应 的 列表 中 。 
并 且 可 以 看 出 ， 数 字 类 型 不 能 在 字符 串 类 型 中 通过 in 进行 成 员 资格 检测 ， 而 字符 串 类 型 可 以 
在 数字 列表 中 通过 in 进行 成 员 资格 检测 。 


3.1.6 长度、 最 小 值 和 最 大 值 
Python 为 我 们 提供 了 长 度 、 最 大 值 和 最 小 值 的 内 建 函 数 , 对 应 的 内 建 函数 分 别 为 len、 max 


和 min。 
这 3 个 函数 该 怎么 使 用 呢 ? 在 交互 模式 输入 : 
>>> numbers=[300,200,100,800,500] 
>>> len(numbers) 
5 
>>> max(numbers) 
800 
>>> min(numbers) 
100 
>>> max(5,3,10,7) 
10 
>>> min(7,0,3,-1) 
-1 


由 上 面 的 结果 可 以 看 到 ，len 函数 返回 序列 中 所 包含 元 素 的 数量 ，max 函数 和 min 函数 分 
别 返 回 序列 中 最 大 和 最 小 的 元 素 。 在 该 示例 中 , 前面 几 个 函数 的 输入 参数 都 是 序列 ， 可 以 使 用 
前 面 的 解释 理解 。max 和 min 函数 的 参数 不 是 一 个 序列 ， 而 是 以 多 个 数字 直接 作为 参数 ， 此 
处 直接 求 取 多 个 数字 的 最 大 值 和 最 小 值 。 





3.2 列表 


前 面 已 经 用 了 很 多 次 列表 ， 可 以 看 出 列表 的 功能 是 比较 强大 的 。 本 节 将 讨论 列表 不 同 于 
元 组 和 字符 串 的 地 方 : 列表 的 内 容 是 可 变 的 (mutable) 。 列 表 有 很 多 比较 好 用 、 比 较 独特 的 
方法 ， 本 节 将 一 一 进行 介绍 。 
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3.2.1 更 新 列表 


我 们 在 3.1 节 中 所 讲述 的 有 关 序 列 的 操作 ， 如 索引 、 分 片 、 相 加 、 乘 法 等 都 适用 于 列表 。 


本 节 将 介绍 一 些 序列 中 没有 而 列表 中 有 的 方法 ， 这 些 方法 的 作用 都 是 更 新 列表 ， 有 元 素 赋值 、 
元 素 删 除 、 分 片 赋值 和 列表 方法 。 下 面 逐一 进行 介绍 。 


1. 元 素 赋值 
我 们 前 面 学 习 过 赋值 语句 ， 赋 值 语句 是 最 简单 地 改变 列表 的 方式 ， 如 a=2 就 是 一 种 改变 


列表 的 方式 。 这 里 我 们 将 通过 编号 标记 某 个 特定 位 置 的 元 素 , 并 对 该 位 置 的 元 素 重 新 赋值 ， 如 
a[1]=10。 在 交互 模式 输入 如 下 : 


>>> a=[1,2,3,2,1] 

>>> a[1]=10 

>>>a 

[ls103,2051] 

>>> a[3]=10 

>>>a 

[1, 10, 3, 10, 1] 

还 记得 我 们 的 编号 是 从 0 开始 吧 ! 

从 上 面 的 输出 结果 可 以 得 知 ， 我 们 可 以 根据 编号 对 列表 中 某 个 元 素 重 新 赋值 。 既 然 可 以 


重新 赋值 ， 是 否 可 以 赋 不 同类 型 的 值 呢 ? 我 们 尝试 一 下 ， 输 入 如 下 : 


例 


>>> a[2]='hello， # 对 编号 为 2 的 元 素 赋值 ， 赋 一 个 字符 串 
>>> 8 

[1, 10, 'hello', 10, 1] 

>>> type(a) 


<class 'list> 

>>> type(a[1]) # 别 忘 了 查看 类 型 函数 的 使 用 
<class 'int> 

>>> type(a[2]) 


<class str> 


由 上 面 的 输出 结果 可 以 得 知 ， 可 以 对 一 个 列表 中 的 元 素 赋 不 同类 型 的 值 。 比 如 上 面 的 示 


， 列 表 a 中 既 有 int 类 型 的 值 ， 也 有 str 类 型 的 值 。 
假如 对 列表 赋值 时 使 用 的 编号 超过 了 列表 中 的 最 大 编号 ， 是 否 还 可 以 赋值 呢 ? 我 们 尝试 
“下 > 输入 如 下 : 


>>> tring=[1.2.3] 
>>> tring[3]='test 
Traceback (most recent call last): 
File "<pyshell#43>", line 1, in <module> 
tring[3]='test' 
IndexError: list assignment index out of range 
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在 上 面 的 示例 中 , tring 的 最 大 编号 是 2, 当 给 编号 为 3 的 元 素 赋值 时 就 会 出 错 。 由 此 得 知 : 
不 能 为 一 个 不 存在 元 素 的 位 置 赋值 。 如 果 一 定 要 赋值 , 前 面 学 习 的 序列 通用 操作 中 的 乘法 可 以 
帮助 我 们 ， 输 入 如 下 : 


>>> tring=[None]*5 

>>> tring[3]='test 

ES tring 

[None, None, None, 'test, None] 


由 以 上 输出 结果 可 以 得 知 ， 可 以 对 初始 化 过 的 位 置 进行 赋值 。 


9: 不 能 为 一 个 不 存在 元 素 的 位 置 赋值 。 
注 意 
2. 增加 元 素 


由 元 素 赋值 的 示例 可 以 看 到 ， 不 能 为 一 个 不 存在 的 位 置 赋值 。 一 旦 初始 化 了 一 个 列表 ， 
就 不 能 再 往 这 个 列表 中 增加 元 素 了 。 若 需 要 往 列表 中 增加 元 素 , 则 需要 将 整个 列表 中 的 元 素 都 
复制 一 遍 , 再 添加 需要 增加 的 元 素 。Python 中 是 否 提供 了 对 应 的 方法 帮助 我 们 做 这 件 事情 呢 ? 
答案 是 肯定 的 。 输 入 如 下 : 


>>> tring=[1,23] 
>>> tring.append(4) 
>>> tring 
[i,2,3,4] 


由 示例 看 到 ， 可 以 使 用 append() 方 法 解决 前 面 的 困惑 。append0 方 法 是 一 个 用 于 在 列表 末 
尾 添加 新 对 象 的 方法 。 该 方法 的 语法 如 下 : 


list.append(obj) 
此 语法 中 list 代表 列表 ，obj 代表 需要 添加 到 list 列表 末尾 的 对 象 。 


C7 append 的 使 用 方式 是 list.append(obj)。 
注意 

由 前 面 的 输出 结果 得 知 : append() 方 法 不 是 简单 地 返回 一 个 修改 过 的 新 列表 ， 而 是 直接 修 
改 原 来 的 列表 。 下 面 展 示 几 个 append0 的 示例 : 


>>> ting=[1.23] 

>>> tring.append('test') # 添 加 字符 串 
>>> tring 

[1, 2, 3, test] 

>>> s=['a','b','c’] 

>>> s.append(3) # 添 加 数字 
>>>s 

['a', bc, 3] 
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由 上 面 的 示例 可 以 得 知 : 可 以 往 数字 序列 中 添加 字符 串 ， 也 可 以 往 字符 串 序 列 中 添加 数字 。 
3. 删除 元 素 

前 面 学 习 了 往 列表 中 增加 元 素 ， 是 否 可 以 在 列表 中 删除 元 素 呢 ? 例如 下 面 的 示例 : 
>>> tring=['a','b','c','d','e'] 

>>> len(tring) 

= 

>>> del tring[1] 

>>> print( 删 除 第 二 个 元 素 : "tring) 

删除 第 二 个 元 素 : [a', 'c,, 'd', 'e] 

>>> len(tring) 

4 


由 上 面 的 示例 看 到 , 可 以 使 用 del 删除 列表 中 的 元 素 。 上 面 的 示例 使 用 del 删除 了 tring 列 
表 中 的 第 二 个 元 素 ， 删 除 元 素 后 ， 原 来 有 5 个 元 素 的 列表 变 成 只 有 4 个 元 素 的 列表 了 。 使 用 
del 除了 可 以 删除 列表 中 的 字符 ， 也 可 以 删除 列表 中 的 数字 ， 输 入 如 下 : 


>>> num=[1,2,3] 

>>> len(num) 

3 

>>> del num[2] 

>>> print( 删 除 第 3 个 元 素 后 : ‘num) 
删除 第 3 个 元 素 后 : [1,2] 

>>> len(num) 

之 


上 面 的 输出 结果 已 经 从 数字 列表 中 删除 了 对 应 的 数字 。 
除了 删除 列表 中 的 元 素 ，del 还 能 用 于 删除 其 他 元 素 ， 具 体 在 后 续 章 节 会 做 详细 介绍 。 


4. 分 片 赋值 
分 片 赋值 是 列表 一 个 强大 的 特性 。 先 看 下 面 的 示例 : 
>>> list( 女 排 夺冠 了 ) 


[ 女 , 排 , 奈 , 冠 "了 ] 
>>> boil=list( 女 排 夺冠 了 ) 
>>> boil 
[| 
>>> show=list('hi,boy'’) 
>>> Show 

Dy ol 

>>> show[3:]=list(‘man') 
>>> show 


和 an 





Python 3.5 从 零 开 始 学 





由 上 述 示 例 可 以 看 出 ， 可 以 通过 分 片 赋值 直接 对 列表 进行 变更 。 示 例 中 我 们 通过 分 片 操 
作 变 更 了 编号 3 之 后 位 置 的 元 素 ， 即 将 boy 替换 为 man 了 。 

上 述 示例 中 引入 了 一 个 新 函数 一 list0 函 数 。list0 函 数 可 以 直接 将 字符 串 转换 为 列表 。 该 
函数 的 一 个 功能 就 是 根据 字符 串 创建 列表 ， 有 时 这 么 操作 会 很 方便 。List0 函 数 不 仅 适用 于 字 
符 串 ， 所 有 类 型 的 序列 它 都 适用 。 

除了 上 面 展 示 的 功能 ， 分 片 赋值 还 有 什么 强大 的 功能 呢 ? 先 看 下 面 的 示例 : 


>>> greeting=list(hi') 

ee greeting 

Ch, 

>>> greeting[1:]=list('ello') 

>>> greeting 

| 

我 们 分 析 一 下 ， 前 面 给 greeting 赋 的 值 是 [h', ' 门 ， 后 面 通 过 分 片 赋值 操作 将 编号 1 之 后 的 
元 素 变更 了 ， 即 将 编号 1 位 置 的 元 素 替 换 为 e 了 ,但 是 编号 2 之 后 没有 元 素 ， 怎 么 能 操作 成 功 
呢 ? 并 且 一 直 操 作 到 编号 为 4 的 位 置 ， 这 怎么 可 以 ? 

这 就 是 分 片 赋值 另 一 个 强大 的 功能 ， 可 以 使 用 与 原 序列 不 等 长 的 序列 将 分 片 替 换 。 

还 有 没有 其 他 功能 呢 ? 请 看 下 面 的 示例 : 

>>> field=list('ae') 

>>> field 

[ae 

>>> field [1:1]=list(bed') 

>>> field 

bas ben, el 

>>> boil=list(' 女 排 夺 冠 了 ') 

>>> boil 

[ 安 , 犊 ," 夺 ,' 冠 ,' 了 1] 

>>> boil[2:2]=list(2016 年 奥运 会 ) 

>>> boil 


[ 女 , ' 排 , 2','0,'1,'6', 年 , 奥 ',' 运 ', 会 ' 夺 ',' 冠 ,' 了 1] 


从 上 面 的 示例 可 以 看 出 ， 可 以 在 不 替换 任何 原 有 元 素 的 情况 下 在 任意 位 置 插入 新 元 素 。 
读者 可 自行 尝试 在 上 面 示例 的 其 他 位 置 进行 操作 。 
当然 ， 上 面 的 示例 程序 只 是 “替换 ”了 一 个 空 分 片 ， 实 际 操作 是 插入 一 个 序列 。 
通过 该 示例 是 否 想起 了 前 面 的 append0) 方 法 ， 不 过 分 片 赋值 比 append() 方 法 强大 多 了 ， 
append() 方 法 只 能 在 列表 尾部 增加 元 素 ， 而 分 片 赋值 可 以 在 任意 位 置 增加 元 素 。 
看 到 这 里 , 是 否 同 时 想起 了 前 面 删除 元 素 的 操作 , 分 片 赋值 是 否 支持 类 似 删除 的 功能 呢 ? 
的 ， 支 持 类 似 删除 的 功能 。 下 面 我 们 证 实 一 下 这 个 猜想 。 


>>> field=-list(abcde) 
>>> field 
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La, bo "He] 

>>> field[1:4]=0] 

>>> field 

[a,'e] 

>>> boil=list(' 女 排 2016 年 奥运 会 夺冠 了 ') 

>>> boil 

[ 女 , 徘 , 206, 年, 奥 , 运 ,会 寿 , 冠 ,了 ] 

>>> boil[2:10]=[] 

>>> boil 

[eo BE | 

>>> del field[1:4] 

>>> field 

[ae 

从 上 面 示例 可 以 看 到 ， 使 用 了 前 面 插入 操作 的 逆 操 作证 实 我 们 的 猜想 。 删 除 和 插入 一 样 ， 
可 以 对 一 个 序列 中 任意 位 置 的 元 素 进行 删除 。 

所 以 通过 分 片 赋值 删除 元 素 也 是 可 行 的 , 并 且 分 片 赋值 删除 的 功能 和 del 删除 的 操作 结果 
是 一 样 的 。 
3.2.2 ” 酝 套 列表 

前 面 介绍 的 都 是 单 层 的 列表 ， 列 表 是 否 可 以 嵌 套 呢 ? 我 们 做 如 下 尝试 : 

>>> field=['a','b','c'] 

>>> field 

['a', 'b', 'e'] 

>>> num=[1,2,3] 

>>> num 

Li 

>>> mix=[field,num] 

>>> mix 

[['a', 'b', 'e'], [1, 2, 3]] 

>>> mix[0] 

| fk | 

>>> mix[1] 


[1,2,3] 
由 上 面 的 操作 结果 得 知 ， 在 列表 中 可 以 嵌 套 列表 ， 嵌 套 的 列表 取出 后 还 是 列表 。 
3.2.3 ”列表 方法 
我 们 之 前 的 章节 介绍 了 函数 ， 本 节 介绍 一 个 与 函数 密切 相关 的 概念 一 一 方法 。 


方法 是 与 对 象 有 紧密 联系 的 函数 ， 对 象 可 能 是 列表 、 数 字 ， 也 可 能 是 字符 串 或 其 他 类 型 
的 对 象 。 方 法 的 调用 方式 前 面 有 一 个 示例 ， 调 用 语法 如 下 : 
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对 象 .方法 (参数 ) 


由 上 面 的 语法 和 前 面 append() 方 法 的 示例 可 知 : 方法 的 定义 方式 是 将 对 象 放 到 方法 名 之 
前 ,两 者 之 间 用 一 个 点 号 隔 开 ,方法 后 面 的 括号 中 可 以 根据 需要 带 上 参数 。 除 了 语法 上 有 一 些 
不 同 ， 方 法 调用 和 函数 调用 很 相似 。 

列表 中 有 count、index、sort 等 比较 常用 的 方法 ， 下 面 逐 一 进行 介绍 。 


1. append 


该 方法 前 面 已 经 介绍 过 ， 功 能 是 在 列表 的 末尾 添加 新 对 象 。 
使 用 方式 为 : 


list.append(obj) 
2. count 


count() 方 法 用 于 统计 某 个 元 素 在 列表 中 出 现 的 次 数 。 
count() 方 法 的 语法 如 下 : 

list.count(obj) 

此 语法 中 list 代表 列表 ，obj 代表 列表 中 统计 的 对 象 。 
使 用 该 方法 的 示例 如 下 : 

>>> field=list('hello,world') 

>>> field 

Dn ea | 

>>> print( 列 表 field 中 ， 字 母 o 的 个 数 : 'field.count(o)) # 统 计 列表 中 的 字符 个 数 
列表 field 中， 字母 o 的 个 数 : 2 

>>> print(' 列 表 field 中 ， 字 母 1 的 个 数 : ,field.count(1")) 

列表 field 中， 字母 1 的 个 数 : 3 

>>> print( 列 表 field 中 ， 字 母 a 的 个 数 : ',field.count(a)) 

列表 field 中 ， 字 母 a 的 个 数 : 0 

>>> listobj = [123, 'hello', ‘world', 123] 

>>> listobj = [26, 'hello', "world', 26] 

>>> print( 数 字 26 的 个 数 : "listobj.count(26)) 

数字 26 的 个 数 : 2 

>>> print(hello 的 个 数 :',listobj.count('hello”)) 关 统计 字符 串 个 数 
hello 的 个 数 : 1 

>>> [ac af,a].count(a') 

3 

>>> mix=[[1,3],5,6,[1,3],2,] 

>>> print(' 嵌 套 列表 mix 中 列表 [1.3] 的 个 数 为 : ',mix.count([1,3])) 
嵌 套 列表 mix 中 列表 [1.3] 的 个 数 为 : 2 





列表 和 元 组 第 3 党 





3. extend 


extend() 方 法 用 于 在 列表 末尾 一 次 性 追加 另 一 个 序列 中 的 多 个 值 ( 用 新 列表 扩展 原来 的 列表 ) 。 
extend() 方 法 的 语法 如 下 : 

list.extend(seq) 

此 语法 中 list 代表 列表 ，seq 代表 元 素 列表 。 

使 用 该 方法 的 示例 如 下 : 

>>> a=['hello','world"] 

>>> b=[pythonvwisvfunny] 

>>> a.extend(b) 


>>>a 
['hello', ‘world', 'python', "is', 'funny'] 


以 上 操作 结果 看 起 来 很 像 连 接 操作 。extend() 方 法 和 序列 相 加 有 什么 区 别 呢 ? 我 们 先 看 看 


下 面 的 示例 : 


>>> a=['hello','world'] 

>>> b=['python','is',funny'] 
>>>atb 

['hello', ‘world', 'python', "is', ’funny'] 
>>>a 

['hello', "world] 


从 输出 的 结果 可 以 看 出 , 两 个 示例 中 a 和 b 赋 值 都 是 一 样 的 , 但 第 一 个 示例 中 输出 a 的 值 


和 第 二 个 示例 中 输出 a 的 值 不 一 样 。 


由 此 我 们 得 出 , extend() 方 法 和 序列 相 加 的 主要 区 别 是 : extend() 方 法 修改 了 被 扩展 的 序列 ， 


如 前 面 的 a;， 原始 的 连接 操作 会 返回 一 个 全 新 的 列表 ， 如 上 面 的 示例 ， 返 回 的 是 一 个 包含 a 和 
b 副本 的 新 列表 ， 而 不 会 修改 原始 的 变量 。 


当然 ， 上 述 示例 也 可 以 用 前 面 学 习 的 分 片 赋值 实现 相同 的 结果 ， 输 入 如 下 : 
>>> a=['hello','world'] 

>>> b=['python','is','funny'] 

>>> al[len(a):]=b 

>>>a 


[hello', ‘world', python', 'is', fanny'] 
可 以 看 到 ， 输 出 结果 和 使 用 extend() 方 法 一 样 ， 不 过 看 起 来 没有 extend() 方 法 易 懂 ， 因 此 


不 会 选择 这 个 方案 。 


4.index 


index() 方 法 用 于 从 列表 中 找 出 某 个 值 第 一 个 匹配 项 的 索引 位 置 。 


S67 
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index() 方 法 的 语法 如 下 : 
list.index(obj) 


此 语法 中 list 代表 列表 ，obj 代表 查找 的 对 象 。 
使 用 该 方法 的 示例 如 下 : 
>>> field=['hello', ‘world', 'python', 'is', 'funny'] 
>>> print(hello 的 索引 位 置 为 : "field.index(hello)) 
hello 的 索引 位 置 为 : 0 
>>> print(python 的 索引 位 置 为 : "field.index(python)) 
python 的 索引 位 置 为 : 2 
>>> print(abc 的 索引 位 置 为 : "field.index(abc)) 
Traceback (most recent call last): 
File "<pyshell#21>", line 1, in <module> 
print('abec 的 索引 位 置 为 : ',field.index('abe')) 


ValueError: 'abc' is not in list 


由 上 面 的 示例 看 到 ， 搜 索 单词 hello， 会 发 现 它 在 索引 号 为 0 的 位 置 ， 搜 索 单 词 python， 
它 在 索引 号 为 2 的 位 置 , 索引 得 到 的 位 置 跟 元 素 在 序列 中 的 位 置 一 样 。 如 果 搜 索 列 表 中 不 存在 
字符 串 ， 操 作 结 果 就 会 出 错 ， 所 以 对 于 不 在 列表 中 的 元 素 ， 用 index0 方 法 操作 时 会 报错 。 

5.insert 

insert() 方 法 用 于 将 对 象 插入 列表 。 

insert() 方 法 的 语法 如 下 : 

list.insert(index,obj) 

此 语法 中 list 代表 列表 ，index 代表 对 象 obj 需要 插入 的 索引 位 置 ，obj 代表 要 插入 列表 中 
的 对 象 。 

使 用 该 方法 的 示例 如 下 : 

>>> num=[1.2,3] 

>>> print(' 插 入 之 前 的 num: ‘num) 

插入 之 前 的 num: [1,2, 3] 

>>> num.insert(2. 插 入 位 置 在 2 之 后 ，3 之 前 ) 

>>> print( 插 入 之 后 的 num: "num) 

插入 之 后 的 num: [1, 2, 插入 位 置 在 2 之 后 ，3 之 前 ', 3] 

由 上 面 的 示例 看 到 ，insert() 方 法 操作 挺 方便 的 。 

与 extend() 方 法 一 样 ，insert() 方 法 的 操作 也 可 以 使 用 我 们 前 面 学 习 的 分 片 赋值 实现 。 

>>> num=[1,2,3] 

>>> print( 插 入 之 前 的 num: ',num) 

插入 之 前 的 num: [1,2,3] 

>>> num[2:2][ 插 入 位 置 在 2 之 后 ，3 之 前 ] 
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>>> print(' 插 入 之 后 的 num: "num) 
插入 之 后 的 num: [1,2, ' 插 入 位 置 在 2 之 后 ，3 之 前 ', 3] 


输出 结果 和 insert 操作 的 结果 一 样 ， 但 看 起 来 没有 使 用 insert 容易 理解 ， 应 该 不 会 选择 这 
个 方案 。 


6. pop 


pop() 方 法 用 于 移 除 列 表 中 的 一 个 元 素 〈 默 认 最 后 一 个 元 素 ) ， 并 且 返 回 该 元 素 的 值 。 

pop() 方 法 的 语法 如 下 : 

list.pop(obj=list[-1]) 

此 语法 中 list 代表 列表 ，obj 为 可 选择 的 参数 ， 代 表 要 移 除 列表 元 素 的 对 象 。 

使 用 该 方法 的 示例 如 下 : 

>>> field=['hello', ‘world', ‘python', 'is', funny'] 

>>> field.pop() # 不 传 参数 ， 默 认 移 除 最 后 一 个 元 素 

‘finny' 

>>> print(' 移 除 元 素 后 的 field: ',field) 

移 除 元 素 后 的 field: ['hello', "world', 'python', "is] 

>>> field.pop(3) # 移 除 编号 为 3 的 元 素 

is 

>>> print(' 移 除 元 素 后 的 field: ',field) 

移 除 元 素 后 的 field: ['hello', "world', 'python'] 

>>> field.pop(0) 

"hello' 

>>> print( 移 除 元 素 后 的 field: ',field) 

移 除 元 素 后 的 field: ['world', 'python'] 

由 上 面 的 示例 看 到 ， 调 用 pop 方法 移 除 元 素 时 ， 在 交互 模式 下 会 告知 我 们 移 除 了 哪个 元 
素 ， 如 上 面 示例 中 的 funny、is。 移 除 funny 时 未 传 参数 ， 默 认 移 除 最 后 一 个 ; is 的 移 除 则 是 根 
据 传 入 的 编号 3 进行 的 。 


9: pop 方法 是 唯一 一 个 既 能 修改 列表 又 能 返回 元 素 值 (除了 None ) 的 列表 方法 。 
注意 

使 用 pop 方法 可 以 实现 一 种 常见 的 数据 结构 一 一 栈 。 

栈 的 原理 就 像 堆 放 盘子 一 样 ， 一 次 操作 一 个 盘子 ， 要 将 若干 盘子 堆 成 一 堆 ， 只 能 在 一 个 盘 
子 的 上 面 放 另 一 个 盘子 ， 要 拿 盘 子 时 ， 只 能 从 顶部 一 个 一 个 往 下 拿 ， 最 后 放 入 的 盘子 是 最 先 被 
拿 的 。 栈 也 是 这 样 ， 最 后 放 入 栈 的 最 先 被 移 除 ， 称 为 LIFO (Last In First Out) ， 即 后 进 先 出 。 

栈 中 的 放 入 和 移 除 操作 有 统一 的 称谓 入 栈 (push) 和 出 栈 (pop) 。Python 没有 入 栈 
方法 ， 但 可 以 使 用 append 方法 代替 。pop 方法 和 append 方法 的 操作 结果 恰好 相反 ， 如 果 入 栈 
《或 追加 ) 刚刚 出 栈 的 值 ， 最 后 得 到 的 结果 就 不 会 变 ， 例 如 以 下 操作 : 
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>>> num=[1,2,3] 

>>> num.append(num.pop()) # 追 加 默认 出 栈 的 值 
>>> print(num 追加 默认 出 栈 值 的 操作 结果 : "num) 

num 追加 默认 出 栈 值 的 操作 结果 : [1,2, 3] 


由 上 面 的 操作 结果 看 到 ， 通 过 追加 默认 出 栈 的 值得 到 的 列表 和 原来 是 一 样 的 。 
7. remove 


remove() 方 法 用 于 移 除 列表 中 某 个 值 的 第 一 个 匹配 项 。 
remove() 方 法 的 语法 如 下 : 


listremove(obj) 


此 语法 中 list 代表 列表 ，obj 为 列表 中 要 移 除 的 对 象 。 
使 用 该 方法 的 示例 如 下 : 
>>> field=[' 女 排 ,精神 ,中 国 ', 精 神 ', 学 习 ', 精 神 ] 
>>> print(' 移 除 前 列表 field: ,field) 
移 除 前 列表 field: 【女排 , ' 精 神 ', "中国 ', 精神 , ' 学 习 ',' 精 神 ] 
>>> field.remove(' 精 神 ') 
>>> print( 移 除 后 列表 field: ,field) 
移 除 后 列表 field: 【' 女 排 , ' 中 国 ', ' 精 神 ,, 学习, 精神 1] 
>>> field.remove('abc') # 删 除 列表 中 不 存在 的 元 素 
Traceback (most recent call last): 

File "<pyshell#71>", line 1, in <module> 

field.remove(abc) 

ValueError': listremove(x): x not in list 


由 上 面 的 输出 结果 看 到 ， 只 有 第 一 次 出 现 的 值 被 移 除了 ， 第 二 次 之 后 出 现 的 值 没 有 被 移 
除 。 上 面 的 列表 中 有 3 个 “精神 ”， 调 用 移 除 方法 后 ， 删 除了 第 一 个 ， 后 面 两 个 仍然 存在 。 
同时 ， 操 作 移 除 列表 中 不 存在 的 值 是 不 行 的 ， 系 统 会 告知 移 除 的 对 象 不 在 列表 中 。 

有 一 点 需要 了 解 的 是 : remove 是 一 个 没有 返回 值 的 原 位 置 元 素 变更 方法 ， 它 修改 了 列表 
却 没有 返回 值 ， 与 pop 方法 正好 相反 。 





8. reverse 


reverse() 方 法 用 于 反 向 列表 中 的 元 素 。 
reverse() 方 法 的 语法 如 下 : 


list.reverse() 


此 语法 中 list 代表 列表 ， 该 方法 不 需要 传 入 参数 。 
使 用 该 方法 的 示例 如 下 : 


>>> num=[1,2,3] 
>>> print( 列 表 反 转 前 num: ,num) 
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列表 反 转 前 num: [1,2, 3] 
>>> num.reverse() 

>>> print( 列 表 反 转 后 :',num) 
列表 反 转 后 : [3, 2, 1] 


由 上 面 的 输出 结果 看 到 ， 该 方法 改变 了 列表 但 不 返回 值 (和 前 面 的 remove 一 样 ) 。 


扩展 : 如 果 需 要 对 一 个 序列 进行 反 向 迁 代 ， 那 么 可 以 使 用 reversed 函数 。 这 个 函数 并 不 
返回 列表 ， 而 是 返回 一 个 迭代 器 (Iterator ) 对 象 (该 对 象 在 后 面 会 详细 介绍 ) ， 可 以 通 
过 list 函数 把 返回 的 对 象 转 换 为 列表 ， 例 如 : 


>>> num=[1,2,3] 
>>> print(' 使 用 reversed 函数 翻转 结果 : ,list(reversed(num))) 
使 用 reversed 函数 翻转 结果 : [3, 2, 1] 


输出 结果 对 原 序列 反 向 迭代 了 .。 


9. sort 


sort() 方 法 用 于 对 原 列表 进行 排序 ， 如 果 指 定 参数 ， 就 使 用 参数 指定 的 比较 方法 进行 排序 。 

sort() 方 法 的 语法 如 下 : 

list.sort(func) 

此 语法 中 list 代表 列表 ，func 为 可 选 参数 。 如 果 指 定 该 参数 ， 就 会 使 用 该 参数 的 方法 进行 
排序 。 

使 用 该 方法 的 示例 如 下 : 

>>> num=[5,8,1,3,6] 

>>> num.sort() 


>>> print(num 调用 sort 方法 后 : ',num) 
num 调用 sort 方法 后 : [1, 3, 5, 6, 8] 


由 上 面 输出 的 结果 得 知 ，sort 方法 改变 了 原来 的 列表 ， 而 不 是 简单 的 返回 一 个 已 排序 的 列 
表 副 本 。 

我 们 前 面 学 习 过 几 个 改变 列表 却 不 返回 值 的 方法 〈 如 append) ， 不 能 将 操作 结果 赋 给 一 
个 变量 ， 这 样 的 行为 方式 很 合 常 理 。 但 当 用 户 需 要 一 个 排 好 序 的 列表 副本 ， 同 时 又 保留 原 有 列 
表 不 变 时 ， 可 能 会 做 如 下 操作 : 


>>> num=[5,8,1.3,6] 

>>> n=num.sort() 

>>> print( 变 量 n 的 结果 是 :,n) 

变量 n 的 结果 是 : None 

>>> print( 列 表 num 排序 后 的 结果 是 :',num) 
列表 num 排序 后 的 结果 是 : [1, 3, 5, 6, 8] 
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输出 结果 怎么 和 我 们 预期 的 不 一 样 呢 ? 因为 sort 方法 修改 了 列表 num， 但 是 返回 的 是 空 
值 ,所 以 我 们 最 后 得 到 的 是 已 排序 的 num 和 值 为 None 的 n。 该 想法 正确 的 实现 方式 是 先 把 num 
的 副本 赋值 给 n， 然 后 对 n 进行 排序 ， 操 作 如 下 : 


>>> num=[5,8,1,3,6] 

>>> n=num # 直 接 将 列表 num 赋值 给 n 
>>> n.Sort(O) 

>>> print( 变 量 n 的 结果 是 :mn) 

变量 n 的 结果 是 : [1, 3, 5, 6, 8] 

>>> print(num 的 结果 是 :num) #num 也 被 排序 了 

num 的 结果 是 : [1, 3, 5, 6, 8] 

>>> num=[5,8,1,3,6] 

>>> n=num[:] # 将 列表 num 切片 后 赋值 给 n 
>>> n.sort() 

>>> print(' 变 量 n 的 结果 是 :mn) 

变量 n 的 结果 是 : [1, 3, 5, 6, 8] 

>>> print(num 的 结果 是 :,num) #num 保持 原样 

num 的 结果 是 : [5, 8, 1, 3, 6] 


由 上 面 的 执行 结果 可 以 看 到 ， 若 不 将 原 列 表 (如 列表 num) 分 片 后 赋值 给 另 一 个 变量 (如 
n) ， 则 两 个 列表 都 会 被 排序 ， 这 样 简单 的 赋值 后 ， 两 个 列表 都 指向 同一 个 列表 。 由 此 提醒 进 
行 该 操作 时 要 记得 对 原 列表 分 片 。 

如 reverse 方法 一 样 ，sort 方 法 也 有 一 个 有 同样 功能 的 函数 一 一 sorted 函数 。 该 函数 可 以 直 
接 获 取 列 表 的 副本 进行 排序 ， 使 用 方式 如 下 : 

>>> num=[5,8,1,3,6] 

>>> n=sorted(num) 

>>> print( 变 量 n 的 操作 结果 是 :',n) 

变量 n 的 操作 结果 是 : [1, 3, 5, 6, 8] 

>>> print(num 的 结果 是 :num) #num 保持 原样 

num 的 结果 是 : [5, 8, 1, 3, 6] 


执行 结果 和 前 面 操作 的 一 样 。sorted 函数 可 以 用 于 任何 序列 ， 返 回 结果 都 是 一 个 列表 。 例 
如 下 面 的 操作 : 

>>> sorted('python') 

[hn '0', p', 4, 'y] 

>>> sorted(321') 

[al 

10. clear 

clear() 方 法 用 于 清空 列表 ， 类 似 于 del a[:]。 

clear() 方 法 的 语法 如 下 : 
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list.clear() 

此 语法 中 list 代表 列表 ， 不 需要 传 入 参数 。 
使 用 该 方法 的 示例 如 下 : 

>>> field=['study','python','is',happy'] 

>>> field.clear() 


>>> print(field 调用 clear 方法 后 的 结果 :,,field) 

field 调用 clear 方法 后 的 结果 : [0] 

由 操作 结果 看 到 ，clear 方法 会 清空 整个 列表 ， 调 用 该 方法 进行 清空 很 简单 ， 但 也 要 小 心 ， 
因为 一 不 小 心 就 可 能 把 整个 列表 都 清空 了 。 

11. copy 

copy() 方 法 用 于 复制 列表 ， 类 似 于 a[:]。 

copy() 方 法 的 语法 如 下 : 

list.copy() 

此 语法 中 list 代表 列表 ， 不 需要 传 入 参数 。 

使 用 该 方法 的 示例 如 下 : 

>>> field=['study','python','is','happy'] 

>>> copyfield=field.copy0) 

>>> print( 复 制 操作 结果 :',copyfield) 

复制 操作 结果 : [study', 'python', 'is', 'happy'] 

操作 结果 和 该 方法 的 意思 一 样 ， 是 原原本本 的 拷贝 操作 。 

12. 高 级 排序 

如 果 希 望 元 素 能 按 特 定 方式 进行 排序 (不 是 sort 方法 默认 的 按 升序 排列 元 素 ) ， 就 可 以 
自 定义 比较 方法 。 

sort 方法 有 两 个 可 选 参 数 ， 即 key 和 reverse。 要 使 用 它们 ， 就 要 通过 名 字 指 定 ， 我 们 称 之 
为 关键 字 参 数 。 例 如 下 面 的 示例 : 

>>> field=['study','python','is','happy'] 


>>> field.sort(key=len) # 按 字符 串 由 短 到 长 排序 

>>> field 

>>> field.sort(key=len,reverse=True) # 按 字符 串 由 长 到 短 排序 ， 传 递 两 个 参数 
>>> field 


['python', 'study', ‘happy", 'is] 

['is', study, happy, ' python] 

>>> num=[5,8,1,3,6] 

>>> num.sort(reverse=True) # 排 序 后 逆序 
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>>>num 
[8, 6, 5, 3, 1] 


由 上 面 的 操作 结果 可 知 ，sort 方法 带 上 参数 后 的 操作 是 很 灵活 的 ， 可 以 根据 自己 的 需要 灵 
活 使 用 该 方法 。 关 于 自 定义 函数 ， 后 续 章节 会 有 更 详细 的 介绍 。 


3.3 元 组 


Python 的 元 组 与 列表 类 似 ， 不 同 之 处 在 于 元 组 的 元 素 不 能 修改 〈 前 面 多 次 提 到 的 字符 串 也 
是 不 能 修改 的 ) 。 创 建 元 组 的 方法 很 简单 :如 果 你 使 用 逗号 分 阳 了 一 些 值 ， 就 会 自动 创建 元 组 。 
例如 ， 我 们 如 下 输入 : 


> 2 

2 

>>> 'hello','world' 

(‘hello', 'world') 

上 面 的 操作 用 逗号 分 隔 了 一 些 值 ， 结 果 输 出 的 是 元 组 。 

我 们 经 常 使 用 圆 括号 将 值 括 起 来 ， 例 如 : 

>>> (1, 2, 3) 

(23 

>>> (‘hello', 'world') 

(‘hello', 'world') 

还 可 以 创建 空 元 组 ， 操 作 如 下 : 

>>>0 

0 

如 果 圆 括号 中 不 包含 任何 内 容 ， 就 是 一 个 空 元 组 。 

创建 包含 一 个 值 的 元 组 如 何 实现 呢 ? 可 以 进行 如 下 尝试 : 

>>> (]) 

1 

输出 结果 不 是 元 组 ， 包 含 一 个 值 的 元 组 的 实现 方式 有 一 些 奇 特 ， 必 须 在 括号 中 的 元 素 后 
加 一 个 逗号 ， 例 如 : 








>>> (1,) 

(1,) 

由 上 面 的 示例 看 到 ， 逗 号 很 重要 ， 只 添加 括号 是 没有 用 的 。 
下 面 我 们 介绍 元 组 的 相关 操作 。 
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3.3.1 tuple 函数 


tuple 函数 的 功能 和 list 函数 基本 上 一 样 ， 都 是 以 一 个 序列 作为 参数 ， 并 把 它 转换 为 元 组 。 
如 果 参 数 是 元 组 ， 参 数 就 会 被 原样 返回 ， 例 如 : 

>>> tuple(['hello','world']) 

(‘hello', 'world') 

>>> tuple(hello) 

Ch eT To) 

>>> tuple((hello,world)) # 参 数 是 元 组 

(‘hello', 'world') 


由 上 面 的 操作 看 到 ，tuple 函数 传 入 元 组 参数 后 ， 得 到 的 返回 值 就 是 传 入 的 参数 。 
3.3.2 元 组 的 基本 操作 


和 列表 一 样 ， 元 组 也 有 一 些 基 本 操作 ， 如 访问 元 组 、 修 改元 组 、 删 除 元 组 、 索 引 和 截取 
等 操作 。 当 然 ， 这 里 的 修改 、 删 除 和 截取 等 操作 和 列表 的 操作 不 太一 样 。 

1. 访问 元 组 

可 以 使 用 下 标 索 引 访问 元 组 中 的 值 ， 例 如 : 

>>> mix = (hello','world', 2015, 2016) 

>>> print ("mix[1] is: ", mix[1]) 

mix[1] is: world 

>>> num = (1,2,3, 4, 5,6,7) 

>>> print ("num[1:5] is: ",num[1:5]) 

num[1:5] is: (2,3, 4, 5) 


2. 修改 元 组 

元 组 中 的 元 素 值 不 允许 修改 ， 但 可 以 对 元 组 进行 连接 组 合 ， 例 如 : 
>>> field = (hello','world) 

>>> num = (2015, 2016) 


>>> print ("合并 结果 为 : ", field+num) 
合并 结果 为 : (hello', 'world', 2015, 2016) 


3. 删除 元 组 
元 组 中 的 元 素 值 不 允许 删除 ， 但 可 以 使 用 del 语句 删除 整个 元 组 ， 例 如 : 


>>> field = (‘hello', 'world'") 

>>> del field 

>>> print( 删 除 后 的 结果 : ',field) 
Traceback (most recent call last): 
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File "<pyshell#84>", line 1, in <module> 
Print(' 删 除 后 的 结果 : "field) 
NameError: name 'field' is not defined 


以 上 实例 的 元 组 被 删除 后 ， 输 出 变量 会 有 异常 信息 ， 输 出 结果 告诉 我 们 field 没有 定义 ， 
即 field 已 经 不 存在 了 。 


4. 元 组 索引 、 截 取 


因为 元 组 也 是 一 个 序列 ， 所 以 可 以 访问 元 组 中 指定 位 置 的 元 素 ， 也 可 以 截取 索引 中 的 一 
段 元 素 ， 例 如 : 

>>> field = (‘hello', 'world', ‘welcome’) 

>>> field [2] 

"welcome' 

>>> field [-2] 

"world' 

>>> field [1:] 


(world'，welcome) 


3.3.3 ”元 组 内 置 函 数 


Python 元 组 提供 了 一 些 内 置 函 数 ， 如 计算 元 素 个 数 、 返 回 最 大 值 、 返 回 最 小 值 、 列 表 转 
换 等 函数 。 

len(tuple) 用 于 计算 元 组 元 素 个 数 。 使 用 方式 如 下 : 

>>> tup = (‘hello', ‘world', 'welcome’) 

>>> len(tup) 

3 

max(tuple) 用 于 返回 元 组 中 元 素 的 最 大 值 。 使 用 方式 如 下 : 

>>> tup=("'6', '3','8") 

>>> max(tup) 

‘8 

min(tuple) 用 于 返回 元 组 中 元 素 的 最 小 值 。 使 用 方式 如 下 : 

>>> tup=('6', '3','8") 

>>> min(tup) 

‘3 

tuple(seq) 用 于 将 列表 转换 为 元 组 。 使 用 方式 如 下 : 

>>> field= ['hello', ‘world', "welcome] 

>>> tup=tuple(field) 

>>> tup 


(‘hello', 'world', 'welcome') 
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以 上 为 Python 中 常见 的 一 些 元 组 的 内 补 函 数 ， 大 家 可 以 自行 操作 其 他 函数 尝试 。 
3.4 ”列表 与 元 组 的 区 别 


我 们 前 面 提 到 列表 与 元 组 的 区 别 在 于 元 组 的 元 素 不 能 修改 ， 元 组 一 旦 初始 化 就 不 能 修改 。 

不 可 变 的 元 组 有 什么 意义 ? 因为 元 组 不 可 变 ， 所 以 代码 更 安全 。 如 果 可 能 ， 能 用 元 组 代 
替 列 表 就 尽量 用 元 组 。 我 们 看 下 面 的 示例 : 

>>t=(a, b,, [A','B') 

>>> t[2J[0] =X' 

>>> [21]='Y' 

> 

Cab,[X,Y]) 

此 处 使 用 了 嵌 套 列表 ， 一 个 列表 中 包含 另 一 个 列表 ， 也 可 以 称 为 二 维 数 组 。 一 个 单一 的 
列表 称 为 一 维 数组 ,还 有 三 维 、 四 维 等 多 维 数组 , 不 过 一 般 一 维和 二 维 数组 用 得 最 多 ， 三维 以 
上 的 数组 基本 很 少 用 到 。 

取 二 维 数组 中 元 素 的 方式 为 : 先 取 得 二 维 数组 里 嵌 套 的 数组 ， 如 上 例 中 的 t[2]， 取 得 的 是 
[A'，'B]，t[2] 是 一 个 一 维 数组 ， 从 一 维 数组 中 获取 元 素 是 以 a[0] 的 方式 获取 的 ， 因 而 从 t[2] 中 
取得 编号 为 0 的 元 素 的 方式 是 t[2][0]。 

上 面 的 元 组 定义 时 有 3 个 元 素 ， 分 别 是 'a'、'b 和 一 个 list 列表 。 不 是 说 元 组 一 旦 定义 就 不 
可 变 了 吗 ? 怎么 后 来 又 变 了 ? 

别 急 ， 我 们 先 看 看 定义 时 元 组 包含 的 3 个 元 素 ， 如 图 3-1 所 示 。 

当 我 们 把 list 列表 的 元 素 'A' 和 'B' 修 改 为 X' 和 'Y' 后 ， 元 组 如 图 3-2 所 示 。 


t 本 
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tuple 
0 [1 [2 o [1 [2 
~、 





















































str Na str 起 
a 'B ‘a 
str str 
'A' X 
图 3-1 元 组 定义 3-2 元 组 “修改 ” 


表面 上 看 ， 元 组 的 元 素 确实 变 了 ， 其 实 变 的 不 是 元 组 的 元 素 ， 而 是 list 列表 的 元 素 。 元 组 
一 开始 指向 的 list 列表 并 没有 改 成 别 的 list 列表， 所 以 元 组 的 “不 变 ”是 指 每 个 元 素 的 指向 永 
远 不 变 ， 如 指向 'a 就 不 能 改 成 指向 只 ， 指 向 一 个 list 就 不 能 改 成 指向 其 他 对 象 ， 但 指向 的 list 
列表 本 身 是 可 变 的 。 
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理解 了 “指向 不 变 ” 后 ， 创 建 一 个 内 容 不 变 的 tuple 要 怎么 做 ? 这 时 必须 保证 tuple 的 每 
一 个 元 素 本 身 也 不 能 变 。 


3.5 调 试 


这 里 通过 设置 的 一 些 错误 让 读者 认识 在 编写 代码 过 程 中 的 常见 问题 ， 以 帮助 读者 熟悉 和 
解决 实际 遇 到 的 问题 。 
(1) 对 序列 中 的 元 素 进行 访问 时 ， 输 入 序列 中 不 存在 的 编号 ， 如 在 greeting='Hello' 示 例 
中 输入 greeting[10], 会 得 到 什么 结果 ? 输入 greeting[-10] 又 会 得 到 什么 结果 ? 在 交互 模式 下 进 
行 验 证 : 
>>> greeting='hello' 
>>> len(greeting) # 获 取 字 符 串 长 度 
3 
>>> greeting[10] ”# 编 号 超过 最 大 长 度 编号 
Traceback (most recent call last): 
File "<pyshell#92>", line 1, in <module> 
greeting[10] 
IndexError: string index out of range 
>>> greeting[5] # 字 符 串 长 度 为 5S， 但 最 大 编号 不 是 5 
Traceback (most recent call last): 
File "<pyshell#97>", line 1, in <module> 
greeting[5] 
IndexError: string index out of range 
>>> greeting[len(greeting)-1] # 最 大 编号 是 字符 串 长 度 减 1 
四 
>>> greeting[-10] 
Traceback (most recent call last): 
File "<pyshell#95>", line 1, in <module> 
greeting[-10] 
IndexError: string index out of range 
>>> greeting[-1] 


Ne 


0 

>>> greeting[-5] 

从 以 上 输出 结果 看 出 ， 以 正 数 索引 时 ， 编 号 从 0 开始， 最 后 一 个 元 素 的 编号 是 len(str)-1; 
以 负数 索引 时 ， 从 -1 开始 ， 可 以 取 到 -len(str) 的 元 素 。 

当 索 引 超出 范围 时 ，Python 会 报 一 个 IndexError 错误 ， 即 索引 越界 错误 。 要 确保 索引 不 越 
界 ， 记 得 最 后 一 个 元 素 的 索引 是 len(str) - 1。 
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(2) 分 片 操作 中 ， 索 引 值 大 于 列表 的 最 大 编号 时 ， 操 作 会 报错 吗 ? 结果 是 怎样 的 ? 在 交 
互 模式 输入 如 下 


>>> number=[1,2,3,4,5,6,7,8,9,10] 

>>> number[7:15] 

[8, 9, 10] 

>>> number[-100:-1] 

[1, 2, 3, 4, 5, 6, 7, 8, 9] # 最 后 一 个 元 素 没有 取 到 


由 以 上 操作 结果 看 到 没有 报错 ， 并 且 超 出 部 分 没有 输出 任何 内 容 。 这 里 要 声明 一 点 : 分 
片 操 作 不 存在 索引 越界 的 问题 ， 分 片 操作 对 不 存在 的 编号 返回 空 值 ， 存 在 的 就 返回 对 应 值 。 所 
以 number[7:15] 返 回 [8, 9, 10]，number[-100:-1] 返 回 [1, 2, 3, 4, 5, 6, 7, 8, 9] 。 

(3) 输入 以 下 代码 会 得 到 什么 结果 ? 


>>> max(a,b,c) 
Traceback (most recent call last): 
File "<pyshell#114>", line 1, in <module> 
max(a,b,c) 





NameError: name 'a' is not defined 

>>> max('a','b','c') 

四 

第 一 个 输出 错误 信息 ， 因 为 a、b、c 没有 定义 ， 这 个 操作 要 注意 字符 串 的 表示 形式 。 第 二 
个 输出 结果 为 ce，max 不 但 能 操作 数字 ， 而 且 能 操作 字符 ， 字 符 按 字典 排序 取 值 。 


3.6 ”问题 解答 


(1) 通用 序列 操作 真 的 通用 吗 ? 

答 : 这 个 是 不 用 质疑 的 ， 已 经 有 很 多 前 辈 大 牛 们 试验 并 已 经 得 出 结论 。 如 果 有 问题 ， 我 
们 可 以 自己 试验 证 明 ， 毕 竟 计 算 机 目前 还 没有 学 会 撒谎 。 

(2) 如 何 选择 使 用 列表 还 是 元 组 ? 

答 : list 和 tuple 是 Python 内 置 的 有 序 集合 ， 一 个 可 变 ， 一 个 不 可 变 。 根 据 需 要 选择 使 用 
其 中 的 一 种 ， 建 议 如 我 们 在 介绍 两 者 区 别 时 所 讲述 的 : 因为 元 组 不 可 变 ， 所 以 代码 更 安全 ， 如 
果 可 能 ， 能 用 元 组 代替 列表 就 尽量 用 元 组 。 


3.7 温 故 知 新 ， 学 以 致 用 


本 章 主要 讲解 了 列表 和 元 组 ， 在 本 章 结束 前 回顾 一 下 学 到 的 概念 。 
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(1) 通用 序列 的 基本 操作 有 哪些 ? 

(2) 列表 有 哪些 操作 和 方法 ? 

(3) 元 组 有 哪些 基本 操作 ? 内 置 函数 如 何 使 用 ? 
(4) 列表 与 元 组 的 区 别 是 什么 ? 


尝试 思考 并 解决 如 下 问题 : 


(1) 用 负数 步 长 对 列表 和 元 组 进行 分 片 。 
(2) 用 索引 取出 下 面 list 的 指定 元 素 : 


field=[ 
['hello', "world', 'welcome’], 
['study', 'Python', "is', ‘funny"], 
['good', 'better', 'best] 

] 


# 输出 hello: 
Print(?) 

# 输出 Python: 
Print(?) 

# 输出 best: 
Print(?) 





第 帮 字 符 证 


我 们 前 面 已 经 接触 过 字符 串 ， 也 了 解 了 一 些 基本 操作 ， 
对 字符 串 的 创建 、 索 引 和 分 片 等 操作 已 经 有 了 初步 理解 。 本 
章 将 介绍 字符 串 的 格式 化 、 分 割 、 搜 索 等 方法 。 


如 





ww A 
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4.1 字符 串 的 基本 操作 


字符 串 是 Python 中 最 常用 的 数据 类 型 。 我 们 可 以 使 用 引号 〈' 或 ") 创建 字符 串 。 创 建 字 
符 串 很 简单 ， 只 要 为 变量 分 配 一 个 值 即 可 。 请 看 下 面 的 例子 : 


>>> field='Hello。 。 # 创 建 字符 串 Hello， 并 赋 给 变量 field 


所 有 标准 序列 操作 《如 索引 、 分 片 、 成 员 资格 、 求 长 度 、 取 最 小 值 和 最 大 值 等 ) 对 字符 
串 同 样 适用 , 我 们 在 前 面 章节 已 经 讲解 了 这 些 操作 。 不 过 字符 串 是 不 可 变 的 , 所 以 字符 串 做 不 
了 分 片 赋值 。 请 看 如 下 操作 : 

>>> field='just do it 

>>> field[-3:] 

it 

>>> field[-3:]='now' 

Traceback (most recent call last): 

File "<pyshell#113>", line 1, in <module> 
field[-3:]='now' 

TypeError: 'str object does not support item assignment 

输出 结果 告诉 我 们 str 类 型 的 对 象 不 支持 更 改 。 

我 们 讲述 了 这 么 多 字符 串 ， 还 没有 看 到 如 何在 输出 语句 中 输出 两 行 ， 这 个 操作 该 怎么 实 
现 呢 ? 例如 : 

>>> print (' 精 诚 所 至 m 金石 为 开 ) 

精诚 所 至 

金石 为 开 

输出 结果 为 两 行 ， 这 里 使 用 了 转 义 字符 \n， 表 示 换 行 。Python 中 有 很 多 转 义 符 ， 表 4-1 列 
出 了 一 些 常用 的 转 义 字符 。 


表 4-1 ”Python 中 的 转 义 字符 


























转 义 字符 描述 描述 
\ (在 行 尾 时 ) | 续 行 符 换行 
\ 反 斜 杠 符号 纵向 制 表 符 
和 单 引号 横向 制 表 符 
. 双 引 号 回 车 
\a 响 铃 换 页 
\b 退 格 (Backspace) 八进制 数 ，yy 代表 的 字符 ， 如 \o12 代表 换行 
\e 转 义 十 六 进 制 数 ，yy 代表 的 字符 ， 如 \x0a 代表 换行 
\000 室 其 他 字符 以 普通 格式 输出 
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对 于 前 面 的 示例 ， 若 要 以 如 下 格式 输出 ， 则 需要 使 用 转 义 字符 : 
' 精 诚 所 至 
' 金 石 为 开 ' 


例如 : 


>>> print ("精诚 所 至 \n' 金 石 为 开 ") # 不 使 用 转 义 字符 

SyntaxError: invalid syntax 

>>> print (\' 精 诚 所 至 \\n\' 金 石 为 开 \") # 使 用 \* 转 义 字符 

' 精 诚 所 至 ' 

' 金 石 为 开 ' 

由 操作 结果 可 知 , 使 用 \ 转 义 字符 得 到 了 想 要 的 结果 , 不 使 用 转 义 字符 不 能 输出 对 应 结果 。 
在 Python 中 进行 字符 串 的 操作 时 ， 如 果 涉 及 一 些 需要 做 转 义 的 操作 ， 就 要 使 用 转 义 字符 。 这 
些 字符 无 须 刻 意 记 忆 ， 先 有 一 些 了 解 即 可 ， 在 后 面 的 学 习 中 结合 实际 操作 会 逐渐 熟练 使 用 。 


4.2 字符 串 格 式 化 


到 目前 为 止 ， 我 们 对 字符 串 的 操作 都 是 停留 在 赋值 、 重 新 赋值 、 索 引 、 分 片 和 输出 等 一 
些 比较 基本 的 操作 上 ， 其 实 字符 串 还 有 更 多 、 更 好 的 操作 方式 ， 比 如 在 实际 项 目 开发 中 经 常 使 
用 的 字符 串 格式 化 操作 。 


4.2.1 字符 串 格式 化 符号 
字符 串 格式 化 使 用 操作 符 百 分 号 (%) 实现 。 


% 也 可 以 用 作 模 运 ( 求 余 ) 操作 符 。 
注 意 
例如 : 
>>> print (‘hello,%s' % 'world') 
hello,world 
>>> print (小 智 今年 %s 岁 了 ' % 10) 
小 智 今年 10 岁 了 


由 上 面 输入 的 内 容 可 知 ,% 左 边 放置 了 一 个 待 格式 化 的 字符 串 , 右边 放置 的 是 希望 格式 化 
的 值 。 格 式 化 的 值 可 以 是 一 个 字符 串 或 数字 。 

格式 化 字符 串 的 %s 部 分 称 为 转换 说 明 符 ， 标 记 了 需要 放置 转换 值 的 位 置 ， 通 用 术语 为 占 
位 符 。 可 以 想象 成 在 学 校 上 自习 , 我 们 通常 会 放 一 个 物品 在 一 个 位 置 上 ,其 他 人 一 看 就 知道 这 
个 位 置 被 占 了 ， 而 我 们 无 论 什 么 时 候 去 自习 ， 直 接 到 自己 占 好 的 位 置 坐 下 即 可 。 这 里 可 以 把 
%s 当 作 我 们 使 用 的 物品 ， 我 们 相当 于 后 面 % 右 边 的 值 。 

在 上 面 的 示例 中 ，s 表示 百 分 号 右边 的 值 会 被 格式 化 为 字符 串 ，s 指 的 是 sr。 如 果 不 是 字 
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符 串 ,就 会 使 用 str 将 其 转换 为 字符 串 。 示 例 中 就 将 10 转换 为 字符 串 了 ,这 种 方式 对 大 多 数 数 
值 都 有 效 。 

这 里 提供 了 字符 串 格式 化 的 方式 ， 但 若 需 要 转换 为 其 他 格式 ， 该 怎么 办 呢 ? Python 为 我 
们 提供 了 表 4-2 所 示 的 格式 化 符号 。 


表 4-2 字符 串 格式 化 符号 


符号 描述 

%f 格式 化 浮 点 数字 ， 可 指定 精度 值 

%e 用 科学 计数 法 格式 化 浮 点 数 

%E 作用 同 %e， 用 科学 计数 法 格式 化 浮 点 数 
%g %f 和 %e 的 简写 

%G %f 和 %E 的 简写 

%p 用 十 六 进 制 数 格式 化 变量 的 地 址 


符号 描述 
%e 格式 化 字符 及 其 ASCII 码 
%s 格式 化 字符 串 
%d 格式 化 整数 
%u 格式 化 无 符号 整 型 
%o 格式 化 无 符号 八进制 数 
%x 格式 化 无 符号 十 六 进 制 数 
%X 格式 化 无 符号 十 六 进 制 数 大写) 
根据 表 4-2， 前 面 的 示例 可 以 使 用 以 下 两 种 方式 : 
>>> print (小 智 今年 %s 岁 了 ' % 10) # 使 用 %s 作为 10 的 占 位 符 
小 智 今年 10 岁 了 
>>> print (小 智 今年 %d 岁 了 ' % 10) # 使 用 %d 作为 10 的 占 位 符 
小 智 今年 10 岁 了 
由 操作 结果 看 到 ， 整 数 既 可 以 使 用 %s 也 可 以 使 用 %d 进行 格式 化 。 
如 果 要 格式 化 实数 〈 浮 点 数 ) ， 就 可 以 使 用 %f 进行 格式 化 ， 例 如 : 
>>> print (圆周 率 PI 的 值 为 : %f % 3.14) 
圆周 率 PI 的 值 为 : 3.140000 
输出 结果 中 有 很 多 位 小 数 ， 但 传 入 的 值 只 有 两 位 小 数 ， 要 解决 这 个 问题 可 以 使 用 格式 化 
符号 。 
从 表 4-2 可 知 ，%f 可 指定 精度 值 。 在 Python 中 ， 使 用 %f 时 ， 若 不 指定 精度 ， 则 默认 输 
出 6 位 小 数 。 
以 指定 2 位 小 数 为 例 ， 指 定 精 度 的 格式 如 下 : 
%.2f 


指定 精度 的 格式 为 一 个 英文 格式 下 的 句点 加 上 希望 保留 的 小 数位 数 。 因 为 格式 化 说 明 符 
以 表示 类 型 的 字符 结束 ， 所 以 精度 应 该 放 在 类 型 字符 前 面 。 

使 用 这 个 格式 更 改 上 面 圆周 率 输出 的 示例 : 

>>> print (圆周 率 PI 的 值 为 : %.2f % 3.14) 

圆周 率 PI 的 值 为 : 3.14 

输出 结果 正 是 我 们 希望 得 到 的 。 

表 4-2 中 的 符号 不 是 所 有 都 常用 ， 比 较 常用 的 有 %s、%d、%f 三 个 ，%e 和 %E 在 科学 计 
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算 中 使 用 比较 多 ， 其 他 符号 了 解 就 可 以 ， 有 兴趣 也 可 以 自行 研究 。 
假如 我 们 要 输出 类 似 1.23% 这 样 的 结果 ， 直 接 使 用 加 号 加 一 个 百 分 号 可 以 吗 ? 尝试 如 下 : 
>>> print (小 智 的 识别 能 力 比 去 年 提高 了 : %.2f % 1.23+'%') 
小 智 的 识别 能 力 比 去 年 提高 了 : 1.23% 


输出 结果 得 到 了 我 们 想 要 的 ， 说 明 这 种 方式 可 以 。 不 过 输入 的 代码 看 起 来 怪 怪 的 ， 有 没 
有 更 好 的 办 法 呢 ? 例如 : 


>>> print (' 小 智 的 识别 能 力 比 去 年 提高 了 : %.2f%6%0' % 1.23) 
小 智 的 识别 能 力 比 去 年 提高 了 : 1.23% 


用 这 种 方式 也 得 到 了 我 们 想 要 的 结果 。 不 过 我 们 在 f 字 符 后 面 使 用 了 两 个 %， 结 果 只 输出 
了 一 个 ， 这 是 怎么 回 事 ? 

在 Python 中 ， 字 符 串 中 的 百 分 号 是 转换 说 明 符 ， 如 果 要 输出 %， 就 需要 格式 化 字符 %， 
从 而 需要 使 用 %%。 使 用 这 种 方式 操作 的 功能 类 似 : 

>>> print (输出 百 分 号 :%s' % '%') 

输出 百 分 号 :% 


4.2.2 ”字符 串 格式 化 元 组 


格式 化 操作 符 的 右 操作 数 可 以 是 任何 元 素 。 如 果 是 元 组 或 映射 类 型 (如 字典 ， 下 一 章 进行 
讲解 ) ， 那 么 字符 串 格式 化 将 会 有 所 不 同 。 我 们 尚未 涉及 映射 字典 ) ， 这 里 先 了 解 一 下 元 组 。 

如 果 右 操作 数 是 元 组 ， 其 中 每 一 个 元 素 都 会 被 单独 格式 化 ， 每 个 值 都 需要 一 个 对 应 的 转 
换 说 明 符 。 例 如 : 

>>> print (今年 是 %s 年 ， 中 国 女 排 夺 得 本 届 奥 运 会 %s， 中 国共 获得 %d 枚 金牌 %('2016', 冠 军 ',26)) 

今年 是 2016 年 ， 中 国 女排 夺 得 本 届 奥 运 会 冠军 ， 中 国共 获得 26 枚 金牌 

>>> print (今年 是 %s 年 ， 中 国 女排 夺 得 本 届 奥 运 会 %s， 中 国共 获得 %d 枚 金牌 '%'2016', 冠 军 ',26) 

Traceback (most recent call last): 

File "<pyshell#149>", line 1, in <module> 
print (今年 是 %s 年 ， 中 国 女排 夺 得 本 届 奥 运 会 %s， 中 国共 获得 %d 枚 金牌 ' %'2016', 冠 军 ',26) 
TypeError: not enough arguments for format string 


由 以 上 输出 结果 看 到 ， 在 有 多 个 占 位 符 的 字符 串 中 ， 可 以 使 用 元 组 传 入 多 个 格式 化 值 。 
如 果 需 要 转换 的 元 组 作为 转换 表达 式 的 一 部 分 存在 ,就 必须 将 它 用 圆 括号 括 起 来 , 否则 会 出 错 。 


如 果 使 用 列表 或 其 他 序列 代替 元 组 ， 序 列 就 会 被 解释 为 一 个 值 。 只 有 元 组 和 字典 可 以 格 
注 意 式 化 一 个 以 上 的 值 。 


下 面 介绍 基本 转换 说 明 符 。 注 意 ， 这 些 项 的 顺序 是 至 关 重 要 的 。 


(1) % 字 符 : 标记 转换 说 明 符 开始 。 
(2) 转换 标志 (可 选 ): -表示 对 齐 ; + 表示 在 转换 值 之 前 要 加 上 正 负 号 ; “”【〔 空 白字 
符 ) 表示 正 数 之 前 保留 空格 ; 0 表示 转换 值 位 数 不 够 时 用 0 填充 。 
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(3) 最 小 字段 宽度 (可 选 ) : 转换 后 的 字符 串 至 少 应 该 具有 该 值 指定 的 宽度 。 如 果 是 *， 
宽度 就 会 从 值 元 组 中 读 出 。 

(4) 点 〈.) 后 跟 精度 值 (可 选 ) : 如 果 转 换 的 是 实数 ， 精 度 值 表示 出 现在 小 数 点 后 的 位 
数 ; 如 果 转 换 的 是 字符 串 ， 该 数字 就 表示 最 大 字段 宽度 ; 如 果 是 *， 精 度 就 会 从 元 组 中 读 出 。 

(5) 转换 类 型 : 参见 表 4-2。 


下 面 将 详细 讨论 上 述 5 个 注意 项 。 

1. 简单 转换 

例如 ， 输 入 以 下 代码 : 

>>> print (圆周 率 PI 的 值 为 : %.2f % 3.14) 

圆周 率 PI 的 值 为 : 3.14 

>>> print (石油 价格 为 每 桶 : $%d' % 96) 

石油 价格 为 每 桶 : $96 

由 上 面 的 输出 结果 可 以 看 到 ， 简 单 转换 只 需要 写 出 转换 类 型 ， 使 用 起 来 很 简单 。 
2. 字段 宽度 和 精度 


转换 说 明 符 包 括 字 段 宽度 和 精度 。 字 段 宽度 是 转换 后 的 值 所 保留 的 最 小 字符 个 数 ， 精 度 
是 数字 转换 结果 中 应 该 包含 的 小 数位 数 或 字符 串 转换 后 的 值 所 能 包含 的 最 大 字符 个 数 。 
例如 : 


>>> print (' 圆 周 率 PI 的 值 为 : %10f % 3.141593) # 字 段 宽度 为 10 

圆周 率 PI 的 值 为 :3.141593 # 字 符 串 宽度 为 10， 被 字符 串 占据 8 个 空格 ， 剩 余 两 个 空格 
>>> print (保留 2 位 小 数 ， 圆 周 率 PI 的 值 为 : %10.2f % 3.141593) # 字 段 宽 度 为 10 

保留 2 位 小 数 ， 圆 周 率 PI 的 值 为 : 3.14 # 字 符 串 宽度 为 10， 字 符 串 占据 4 个 ， 剩 6 个 
>>> print (保留 2 位 小 数 ， 圆 周 率 PI 的 值 为 : %.2f % 3.141593) 

保留 2 位 小 数 ， 圆 周 率 PI 的 值 为 : 3.14 # 输 出 ， 没 有 字段 宽度 参数 

>>> print (字符 串 精度 获取 : %.5s' % (hello world')) # 打 印字 符 串 前 5 个 字符 

字符 串 精 度 获 取 : hello 


由 输出 结果 可 知 ， 字 段 宽度 和 精度 都 是 整数 ， 并 通过 点 号 〈.) 分 隔 。 两 个 都 是 可 选 参数 ， 
如 果 给 出 精度 ， 就 必须 包含 点 号 。 


再 看 以 下 代码 : 
>>> print (从 元 组 中 获取 字符 串 精 度 : %*.*s' % (10,5,hello world)) 
从 元 组 中 获取 字符 串 精度 : hello # 输 出 字符 串 宽 度 为 10、 精 度 为 5 


>>> print (' 从 元 组 中 获取 字符 串 精度 : %.*s' % (5,'hello world')) 
从 元 组 中 获取 字符 串 精度 : hello # 输 出 精度 为 5 


由 输出 结果 看 到 ， 可 以 使 用 *〈 星 号 ) 作为 字段 宽度 或 精度 〈 或 两 者 都 用 * ) ， 数 值 会 从 
元 组 中 读 出 。 
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3. 符号 、 对 齐 和 0 填充 
开始 介绍 之 前 先 看 一 个 示例 : 


>>> print (' 圆 周 率 PI 的 值 为 : %010.2f % 3.141593) 
圆周 率 PI 的 值 为 : 0000003.14 


输出 结果 是 不 是 怪 怪 的 ， 这 个 我 们 称 之 为 “ 标 表 ”。 在 字段 宽度 和 精度 之 前 可 以 放置 一 
个 “ 标 表 ”， 可 以 是 零 、 加 号 、 减 号 或 空格 。 零 表示 用 0 进行 填充 。 

减 号 (-) 用 来 左 对 齐 数值 ， 例 如 : 

>>> print (' 圆 周 率 PI 的 值 为 : %10.2f % 3.14) 

圆周 率 PI 的 值 为 : 3.14 

>>> print (' 圆 周 率 PI 的 值 为 : %-10.2f % 3.14) 

圆周 率 PI 的 值 为 : 3.14 # 此 处 右 侧 为 多 出 的 空格 


从 输出 结果 看 到 ， 使 用 减 号 时 ， 数 字 右 侧 多 出 了 额外 的 空格 。 
空白 (“”) 表示 在 正 数 前 加 上 空格 ， 例 如 : 
print(('% 5d' % 10)+\n'+(% 5d' % -10)) 
10 
-10 
由 输出 结果 可 以 看 到 ， 该 操作 可 以 用 于 对 齐 正 负数 。 
加 号 (+) 表示 无 论 是 正 数 还 是 负数 都 表示 出 符号 ， 例 如 : 
>>> print((' 宽 度 前 加 加 号 : %+5d'%10)+\n'+(' 宽 度 前 加 加 号 : %+5d'%-10)) 


宽度 前 加 加 号 : ”+10 
宽度 前 加 加 号 : 。 -10 


该 操作 也 可 以 用 于 数值 的 对 齐 。 
4.3 字符 串 方法 


第 3 章 介绍 了 很 多 列表 的 方法 , 字符 串 的 方法 比 列表 还 多 , 因为 字符 串 从 string 模块 中 “ 继 
承 ” 了 很 多 方法 。 

因为 字符 串 的 方法 比较 多 ， 所 示 这 里 只 介绍 一 些 特别 有 用 的 方法 ， 全 部 方法 见 附录 A。 
4.3.1 find() 方 法 


find() 方 法 用 于 检测 字符 串 中 是 否 包含 子 字符 串 str。 如 果 指 定 beg (开始 ) 和 end (结束 ) 
范围 , 就 检查 是 否 包含 在 指定 范围 内 。 如 果 包 含 子 字符 串 , 就 返回 开始 的 索引 值 ; 否则 返回 -1 。 
find() 方 法 的 语法 如 下 : 


str.find(str, beg=0, end=len(string)) 
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此 语法 中 str 代表 指定 检索 的 字符 串 ，beg 代表 开始 索引 ， 默 认为 0，end 代表 结束 索引 ， 
默认 为 字符 串 的 长 度 。 返 回 结果 为 子 串 所 在 位 置 的 最 左 端 索引 ， 如 果 没 有 找到 ， 就 返回 -1。 
该 方法 使 用 示例 如 下 : 


>>> field='do it now’ 
>>> field.find('do') 

0 

>>> field.find(now') 

6 

>>> field.find('python') 
-1 


由 输出 结果 看 到 , 如果 找到 字符 串 ， 就 返回 对 应 的 索引 值 ; 如 果 没 找到 字符 串 ; 就 返回 -1。 








C7 字符 串 的 find 方法 返回 的 不 是 布尔 值 。 如 果 返 回 0， 就 表示 在 索引 0 处 找到 了 子 字符 串 。 
注 意 

find 方法 还 可 以 接受 参数 ， 用 于 表示 起 始点 和 结束 点 ， 例 如 : 

>>> field.find(it,2) # 提 供 起 点 

4 field.find('it,5) # 提 供 起 点 

field.find('it,0,3) # 提 供 起 点 和 终点 

field.find('it,0,5) 

a field.find('it',5,10) 

可 


由 输出 结果 看 到 ， 可 以 通过 使 用 起 始 值 和 终止 值 查 找 指定 的 范围 内 是 否 存 在 指定 字符 串 。 
4.3.2 join() 方 法 

join() 方 法 用 于 将 序列 中 的 元 素 以 指定 字符 连接 成 一 个 新 字符 串 。 

join() 方 法 的 语法 如 下 : 

str.join(sequence) 

此 语法 中 str 代表 指定 检索 的 字符 串 ，sequence 代表 要 连接 的 元 素 序列 。 返 回 结果 为 指定 
字符 连接 序列 中 元 素 后 生成 的 新 字符 串 。 

该 方法 使 用 示例 如 下 : 

>>> num=[1,2,3,4] 


>>> mark="+" 














>>> markjoin(num) 
Traceback (most recent call last): 
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File "<pyshell#219>", line 1, in <module> 
mark.join(num) 
TypeError: sequence item 0: expected str instance, int found 
>>> num.join(mark) 
Traceback (most recent call last): 
File "<pyshell#216>", line 1, in <module> 
num.join(mark) 
AttributeError: 'list' object has no attribute 'join' 
>>> field=["1,2',3',4",'5'] 
>>> print( 连 接 字 符 串 列表 : ',mark.join(field)) 
连接 字符 串 列表 : ”1+2+3+4+5 
>>> field.join(mark) 
Traceback (most recent call last): 
File "<pyshell#228>", line 1, in <module> 
field.join(mark) 
AttributeError: 'list' object has no attribute 'join' 
>>> dirs=",home','data','hdfs' 
>>> print( 路 径 : ,join(dirs)) 
路 径 : /home/data/hdfs 


由 输出 结果 看 到 ， 进 行 join 操作 调用 和 被 调用 的 对 象 必须 都 是 字符 串 ， 任 意 一 个 不 是 字 


4.3.3 ”lower() 方 法 


lower() 方 法 用 于 将 字符 串 中 所 有 大 写字 符 转 换 为 小 写 。 
lower() 方 法 的 语法 如 下 : 


str.lower() 


此 语法 中 str 代表 指定 检索 的 字符 串 ， 该 方法 不 需要 参数 。 返 回 结果 为 字符 串 中 所 有 大 写 





字符 转换 为 小 写 后 生成 的 字符 串 。 
该 方法 使 用 示例 如 下 : 
>>> field='DO IT NOW' 
>>> print( 调 用 lower 得 到 字符 串 : "fieldlowerO) 
调用 lower 得 到 字符 串 : do it now 
>>> greeting='Hello, World' 
>>> print( 调 用 lower 得 到 字符 串 : ',greeting.lower()) 
调用 lower 得 到 字符 串 : hello.world 


由 输出 结果 看 到 ， 字 符 串 中 的 大 写字 母 全 部 转换 为 小 写字 母 了 。 


如 果 想 要 编写 “不 区 分 大 小 写 ” 的 代码 ， 就 可 以 使 用 lower 方法 。 如 果 想 要 在 一 个 字符 串 


中 查找 某 个 子 字符 串 并 忽略 大 小 写 ， 也 可 以 使 用 lower 方法 ， 操 作 如 下 : 
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>>> field='"DO IT NOW" 

>>> field.find(It") # 都 不 转换 为 小 写 ， 找 不 到 匹配 字符 串 

| 

>>> field.lower().find('It) # 被 查找 字符 串 不 转换 为 小 写 ， 找 不 到 匹配 字符 串 
a 

>>> field.lower().find('It.lower()) # 使 用 lower 方法 转换 成 小 写 后 查找 

3 


由 输出 结果 看 到 ， 字 符 串 全 部 转换 为 小 写 后 能 匹配 到 对 应 子 串 。 


有 时 类 似 于 lower 这 样 的 字符 串 方 法 并 不 能 如 我 们 所 愿 进行 工作 ,对 于 英文 字符 串 , lower 
(© 方法 在 处 理 时 一 点 问题 都 没有 ; 对 于 非 英文 字符 囊 ，lower 方法 在 处 理 时 可 能 不 如 我 们 的 
注 意 预期 ， 如 中 文 、 气 威 文 等. 


4.3.4 ”upper() 方 法 


upper() 方 法 用 于 将 字符 串 中 的 小 写字 母 转换 为 大 写字 母 。 

upper() 方 法 语法 如 下 : 

str.upper() 

此 语法 中 str 代表 指定 检索 的 字符 串 ， 该 方法 不 需要 参数 。 返 回 结果 为 小 写字 母 转换 为 大 
写字 母 的 字符 串 。 

该 方法 使 用 示例 如 下 : 

>>> field='do it now' 

>>> print(' 调 用 upper 得 到 字符 串 : ,field.upper()) 

调用 upper 得 到 字符 串 ， DO IT NOW 

>>> greeting='Hello, World' 

>>> print( 调 用 upper 得 到 字符 串 : ',greeting.upper()) 

调用 upper 得 到 字符 串 : HELLO,WORLD 


由 输出 结果 看 到 ， 字 符 串 中 的 小 写字 母 全 部 转换 为 大 写字 母 了 。 

如 果 想 要 编写 “不 区 分 大 小 写 ” 的 代码 ， 就 可 以 使 用 upper 方法 。 如 果 想 要 在 一 个 字符 串 
中 查找 某 个 子 字符 串 并 忽略 大 小 写 ， 也 可 以 使 用 upper 方法 ， 操 作 如 下 : 

>>> field='do it now' 

>>> field.find(It") # 都 不 转换 为 大 写 ， 找 不 到 匹配 字符 串 

-1 

>>> field.upper().find('It) # 被 查找 字符 串 不 转换 为 大 写 ， 找 不 到 匹配 字符 串 

-1 


>>> field.upper()-find('It.upper()) # 使 用 upper 方法 转换 为 大 写 后 查找 
3 


由 输出 结果 看 到 ， 字 符 串 全 部 转换 为 大 写 后 能 找到 对 应 子 串 。 
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4.3.5 swapcase() 方 法 


swapcase() 方 法 用 于 对 字符 串 的 大 小 写字 母 进行 转换 ， 将 字符 串 中 大 写 转换 为 小 写 、 小 写 
转换 为 大 写 。 
swapcase() 方 法 的 语法 如 下 : 


str.swapcase() 


此 语法 中 str 代表 指定 检索 的 字符 串 ， 该 方法 不 需要 参数 。 返 回 结果 为 大 小 写字 母 转换 后 
生成 的 新 字符 串 。 
该 方法 使 用 示例 如 下 : 


>>> field='Just do itNOW' 

>>> print( 原 字符 串 : "field) 

原 字 符 串 :Just do itNOW 

>>> print( 调 用 swapcase 方法 后 得 到 的 字符 串 : "field.swapcase()) 
调用 swapcase 方法 后 得 到 的 字符 串 : jUSTDO ITnow 


由 输出 结果 看 到 ， 调 用 该 方法 后 ， 输 出 结果 中 的 大 写字 母 变 为 小 写 、 小 写字 母 变 为 大 写 。 
该 方法 进行 大 小 写 转换 非常 方便 。 
4.3.6 replace() 方 法 

replace() 方 法 把 字符 串 中 的 old〈 旧 字符 串 ) 蔡 换 成 new《〔〈 新 字符 串 ) ， 如 果 指 定 第 3 个 


参数 max， 蔡 换 次 数 就 不 超过 max 次 。 
replace() 方 法 的 语法 如 下 : 





str.replace(old, new[, max]) 


此 语法 中 str 代表 指定 检索 的 字符 串 ; old 代表 将 被 蔡 换 的 子 字符 串 ，new 代表 新 字符 串 ， 
用 于 替换 old 子 字符 串 ; max 代表 可 选 字 符 串 ,替换 次 数 不 超 过 max 次 。 返 回 结果 为 字符 串 中 
的 old〔 旧 字符 串 ) 替 换 成 new《〈 新 字符 串 ) 后 生成 的 新 字符 串 ， 如 果 指 定 第 3 个 参数 max， 
替换 次 数 就 不 超过 max 次 。 

该 方法 使 用 示例 如 下 : 


>>> field='do it now,do right now' 

>>> print( 原 字符 串 : ,field) 

原 字符 串 : do it now,do right now 

>>> print( 新 字符 串 : ',field.replace('do','Just do)) 
新 字符 串 : ”Just do it now,Just do right now 

>>> print( 新 字符 串 : ',field.replace('0','Just,1)) 
新 字符 串 :djJust it now,do right now 

>>> print( 新 字符 串 : ',field.replace('0',Just,2)) 
新 字符 串 : ”djJust it nJustw,do right now 
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>>> print( 新 字符 串 : ',field.replace('0','Just,3)) 
新 字符 串 :djJust it njJustw,dJust right now 


由 上 面 输出 结果 看 到 ， 当 不 指定 第 3 个 参数 时 ， 所 有 匹配 字符 都 替换 ， 指 定 第 3 个 参数 
时 ， 蔡 换 从 左 往 右 进行 ， 蔡 换 次 数 不 超 过 指定 次 数 。 


4.3.7 split() 方 法 


split() 方 法 通过 指定 分 隔 符 对 字符 串 进 行 切片 ， 如 果 参 数 num 有 指定 值 ， 就 只 分 阳 num 
个 子 字符 串 。 这 是 一 个 非常 重要 的 字符 串 方法 ， 是 join 的 逆 方 法 ， 用 来 将 字符 串 分 割 成 序列 。 
split0 方 法 的 语法 如 下 : 


str.split(st="", num=string.count(str)) 


此 语法 中 str 代表 指定 检索 的 字符 串 ;， st 代表 分 隔 符 ， 默 认为 空格 ;num 代表 分 割 次 数 。 
返回 结果 为 分 割 后 的 字符 串 列 表 。 

该 方法 使 用 示例 如 下 : 

>>> field='do it now' 

>>> print( 不 提供 任何 分 割 符 分 隔 后 的 字符 串 : ',field.split0)) 

不 提供 任何 分 割 符 分 隔 后 的 字符 串 : [do,'it, now] 

>>> print( 根 据 i 分隔 后 的 字符 串 : "field.split(iD) 

根据 i 分隔 后 的 字符 串 : [do ,tnow'] 

>>> print( 根 据 o 分 隔 后 的 字符 串 : ,field.split(0')) 

根据 分 隔 后 的 字符 串 : ['d', "it nm','w] 

>>> print(' 根 据 o 分 隔 1 次 后 的 字符 串 :',field.split('0',1)) 

根据 o 分 隔 1 次 后 的 字符 串 : [ditnow] 


由 输出 结果 看 到 ， 如 果 不 提 供 分 隔 符 ， 程 序 就 会 把 所 有 空格 作为 分 割 符 。 操 作 中 可 以 指 
定 分 隔 符 和 分 割 次 数 ， 若 指定 分 割 次 数 ， 则 从 左 往 右 检索 和 分 隔 符 匹配 的 字符 ， 分 割 次 数 不 超 
过 指定 次 数 ， 若 不 指 分 割 次 数 ， 则 所 有 匹配 的 字符 都 会 被 分 割 。 
4.3.8 strip() 方 法 


strip() 方 法 用 于 移 除 字 符 串 头 尾 指定 的 字符 〈 默 认为 空格 ) 。 
strip() 方 法 的 语法 如 下 : 





str.strip([chars]) 

此 语法 中 str 代表 指定 检索 的 字符 串 ，chars 代表 移 除 字符 串 头 尾 指定 的 字符 。 返 回 结果 为 
移 除 字符 串 头 尾 指 定 的 字符 生成 的 新 字符 串 。 

该 方法 使 用 示例 如 下 : 

>>> field='---do it noW—--" 

>>> print( 原 字符 串 : "field) 

原 字符 串 :一 -do it now 一 -- 
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>>> print( 新 字符 串 : "field.strip(-)) 
新 字符 串 : do itnow 

>>> st="----do 一 让 --now-- 一 

>>> print( 原 字符 串 : "sb 

原 字 符 串 : ”一 -do 一 it -- now---- 
>>> print( 新 字符 串 : ',st.strip("-')) 
新 字符 串 : do --it--now 


由 操作 结果 看 到 ，strip 方法 只 去 除 头 尾 匹 配 的 字符 ， 中 间 匹 配 的 字符 不 会 去 除 。 
4.3.9 translate() 方 法 


translate() 方 法 根据 参数 table 给 出 的 表 (包含 256 个 字符 ) 转换 字符 串 的 字符 ， 将 要 过 滤 
掉 的 字符 放 到 del 参数 中 。 
translate() 方 法 的 语法 如 下 : 


str.translate(table[, deletechars]) 


此 语法 中 str 代表 指定 检索 的 字符 串 ，table 代表 翻译 表 ， 翻 译 表 通 过 maketrans 方法 转换 
而 来 ，deletechars 代表 字符 串 中 要 过 滤 的 字符 列表 。 返 回 结果 为 翻译 后 的 字符 串 。 

该 方法 使 用 示例 如 下 : 

>>> intab='adfas' 

>>> outtab="12345' 

>>> trantab=str.maketrans(intab,outtab) 

>>> st='just do it 

>>> print('st 调用 translate 方法 后 : ',st.translate(trantab)) 

st 调用 translate 方法 后 : ju5t 20 it 


由 输出 结果 看 到 ， 有 几 个 字符 被 蔡 换 成 数字 了 ， 被 替换 的 字符 既 在 intab 变量 中 ， 又 在 st 
变量 中 ， 如 图 4-1 所 示 。 对 于 既 在 intab 中 ， 又 在 st 中 的 字符 ,使 用 outtab 中 对 应 的 字符 替换 。 
由 图 4-1 可 知 ，intab 中 的 字符 d 对 应 outtab 中 的 字符 2、 字符 s 对 应 字符 5， 所 以 最 后 输出 字 
符 串 中 的 s 被 替换 成 5、d 被 蔡 换 成 2， 这 样 就 得 到 了 最 后 我 们 看 到 的 字符 串 js5t 20 it。 















































rl le 
| 1 

















4-1 字符 串 对 应 关系 


"93 。 





Python 3.5 从 零 开 始 学 





translate 方法 和 replace 方法 一 样 , 可 以 替换 字符 串 中 某 些 部 分 。 和 replace 方法 不 同 的 是 ， 
translate 方法 只 处 理 单个 字符 ,translate 方法 的 优势 在 于 可 以 同时 进行 多 个 替换 ,有 时 比 replace 
方法 效率 高 得 多 。 





44 调 试 


这 里 通过 设置 的 一 些 错误 让 读者 认识 在 编写 代码 过 程 中 的 常见 问题 ， 以 帮助 读者 熟悉 和 
解决 实际 遇 到 的 问题 。 
(1) 使 用 格式 化 整数 的 占 位 符 格式 化 字符 串 ， 例 如 : 


>>> print (‘hello,%d' % "world) 
Traceback (most recent call last): 
File "<pyshell#120>", line 1, in <module> 
Print (hello,%d % "world') 
TypeError: %d format: a number is required, not str 


输出 结果 告诉 我 们 需要 一 个 数字 ， 而 不 是 字符 串 。 

(2) 在 使 用 %f 输 出 圆周 率 的 示例 中 ， 若 更 改 为 使 用 %d 输出 ， 结 果 会 怎样 ? 输入 如 下 : 
>>> print (' 圆 周 率 PI 的 值 为 : %d' % 3.14) 
圆周 率 PI 的 值 为 : 3 
结果 把 小 数 点 后 的 数值 都 抛弃 了 。 

(3) 在 用 0 填充 的 示例 中 ， 把 010 的 第 一 个 0 更 改 为 其 他 数字 ， 看 看 输出 结果 。 再 在 精 

度 之 前 添加 一 个 0 或 大 于 0、 小 于 0 的 数字 ， 看 看 输出 结果 。 

>>> print (' 圆 周 率 PI 的 值 为 : %06.2f % 3.141593) 
圆周 率 PI 的 值 为 : 003.14 
>>> print (' 圆 周 率 PI 的 值 为 : %16.2f % 3.141593) 
圆周 率 PI 的 值 为 : 3.14 
>>> print (' 圆 周 率 PI 的 值 为 : %.02f % 3.141593) 
圆周 率 PI 的 值 为 : 3.14 
>>> print (圆周 率 PI 的 值 为 : %.12f % 3.141593) 
圆周 率 PI 的 值 为 ， 3.141593000000 
>>> print (圆周 率 PI 的 值 为 : %.-12f % 3.141593) 
Traceback (most recent call last): 

File "<pyshell#179>", line 1, in <module> 

print (圆周 率 PI 的 值 为 : %.-12f % 3.141593) 

ValueError: unsupported format character '-' (0x2d) at index 11 


由 输出 结果 看 到 ， 将 宽度 前 面 的 0 更 改 为 其 他 数字 会 认 作 宽度 值 ， 而 不 是 填充 值 。 在 精 
度 前 面 加 0 对 结果 没有 影响 ; 若 添加 大 于 0 的 数字 ， 则 作为 小 数 的 实际 位 数 输出 , 位 数 不 够 后 
面 补 0; 车 添加 小 于 0 的 数字 ， 则 报 异 常 。 
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4.5 ”问题 解答 


(1) 字符 串 格 式 化 在 项 目 实战 中 一 般 用 于 做 什么 ? 

答 : 一 般 用 于 输入 信息 的 格式 化 ， 比 如 程序 中 的 查询 语句 ， 经 常 需要 查看 一 个 查询 语句 
查找 到 了 多 少 记录 。 对 于 我 们 而 言 , 不 可 能 每 次 都 手动 执行 查询 语句 ， 这 时 就 可 以 用 字符 串 格 
式 化 语句 将 查询 结果 格式 化 到 字符 串 中 ， 我 们 查看 输出 结果 即 可 。 

(2) 本 章 中 列举 的 字符 串 方法 很 常用 吗 ? 

答 : 这 个 要 看 接触 的 是 什么 样 的 工作 内 容 ， 基 本 上 都 会 经 常用 到 ， 这 也 是 大 家 在 使 用 过 
程 中 慢 慢 发 现 的 ， 是 基于 实战 经 验 的 积累 ， 在 平时 使 用 频率 都 比较 高 。 当 然 , 有 一 些 这 里 没有 
列举 出 来 的 方法 ， 在 实际 使 用 中 也 会 经 常用 到 ， 大 家 用 到 时 可 以 自己 查看 相关 资料 。 





4.6 温 故 知 新 ， 学 以 致 用 


本 章 主要 讲解 了 字符 串 ， 在 本 章 结束 前 回顾 一 下 学 到 的 概念 。 

(1) 字符 串 有 哪些 基本 操作 ? 

(2) 字符 串 格式 化 的 方式 有 哪些 ? 

(3) 字符 串 比较 常用 的 方法 有 哪些 ， 该 怎么 使 用 ? 

尝试 思考 并 解决 如 下 问题 : 

小 智 的 智商 从 去 年 的 100 分 提升 到 了 今年 的 132 分 ， 请 计算 小 智 智商 提升 的 百分比 ， 并 
用 字符 串 格式 化 显示 出 “xx.x%” 的 形式 ， 保 留 一 位 小 数 。 





如 
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通过 第 3 章 对 列表 的 学 习 , 我 们 了 解 到 列表 可 以 将 值 分 
组 到 一 个 结构 中 ， 并 通过 编号 进行 引用 。 

本 章 将 介绍 一 种 通过 名 字 引 用 值 的 数据 结构 , 这 种 结构 
类 型 称 为 映射 (mapping) 。 字 典 是 Python 中 唯一 内 建 的 映 
射 类 型 , 字典 指定 值 并 没有 特殊 顺序 ， 都 存储 在 一 个 特殊 的 
键 (Key) 里 ， 键 可 以 是 数字 、 字 符 串 或 元 组 。 

字典 是 另 一 种 可 变 容器 模型 ， 可 存储 任意 类 型 对 象 。 
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5.1 字典 的 使 用 


字典 这 个 数据 结构 的 功能 就 跟 它 的 名 字 一 样 ， 可 以 像 《 汉 语 字典 》 一 样 使 用 。 在 使 用 汉 
语 字典 时 , 我 们 可 以 从 头 到 尾 一 页 一 页 查找 某 个 字 , 也 可 以 通过 拼音 索引 或 笔画 索引 快速 找到 
某 个 字 ， 在 汉语 字典 中 找 拼音 索引 和 笔画 索引 非常 轻松 简单 。 

在 Python 中 对 字典 进行 了 构造 ， 让 我 们 可 以 轻松 查 到 某 个 特定 的 键 〈 类 似 拼音 或 笔画 索 
引 》 ， 从 而 通过 键 找到 对 应 的 值 〈 类 似 具 体 某 个 字 ) 。 

假如 需要 创建 一 个 可 以 存储 学 生 姓名 和 学 号 的 小 型 数据 库 ， 应 该 怎么 做 呢 ? 我 们 尝试 使 
用 之 前 学 习 过 的 列表 实现 ， 例 如 : 

>>> students=[' 小 萌 "" 小 智 小 强 ', 小 张 ," 小 李 '] 

>>> numbers=["1001',1002',1003',1004',10051] 

>>> print( 小 智 的 学 号 是 : ,numbers[students.index(' 小 智 )]) 

小 智 的 学 号 是 : 1002 

输出 结果 是 我 们 想 要 的 ， 但 是 当 数 据 量 比较 大 时 ， 显 然 不 适用 。 数 据 量 比较 大 时 ， 意 味 
着 要 对 学 生 姓名 列表 创建 一 个 有 同样 多 元 素 的 学 号 列表 , 一 旦 列表 发 生变 更 , 就 要 将 学 号 列表 
和 学 生 姓名 列表 进行 逐步 比 对 ， 以 进行 相应 变更 。 

我 们 想 要 的 真正 效果 是 像 使 用 index 方法 一 样 ，index 返回 的 是 索引 位 置 ， 我 们 希望 直接 
返回 索引 位 置 上 的 值 ， 比 如 : 

>>> print( 小 智 的 学 号 是 :numbers[" 小 智 ]) 

小 智 的 学 号 是 : 1002 

这 种 方式 可 以 实现 ， 如 果 numbers 是 字典 ， 就 可 以 这 么 操作 并 得 到 结果 。 具 体 可 以 看 5.2 
节 的 讲解 。 





5.2 ”创建 和 使 用 字典 


字典 的 创建 格式 如 下 : 

>>> d= {keyl : valuel, key2 : value2 } 

字典 由 多 个 键 及 其 对 应 的 值 构成 的 对 组 成 (把 键 / 值 对 称 为 项 ) 。 字 典 的 每 个 键 / 值 
(key/value) 对 用 冒号 〈:) 分 割 ， 每 个 项 之 间 用 逗号 〈,) 分割， 整个 字典 包括 在 花 括号 ({}) 
中 。 空 字典 不 包括 任何 项 ) 由 两 个 大 括号 组 成 ， 如 {}。 

键 必须 是 唯一 的 ， 但 值 不 必 。 值 可 以 取 任何 数据 类 型 ， 键 必须 是 不 可 变 的 ， 如 字符 串 、 
数字 或 元 组 。 
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下 面 是 一 个 简单 的 字典 示例 : 
>>> dict = { 小 萌 ':'1001. ' 小 智 :'1002', "小 强 ': '1003'} 
也 可 以 为 如 下 形式 : 


>>> dictl = {'abe': 456 } 
>>> dict2 = frabc': 123, 98.6: 37 } 


5.2.1 dict 函数 


可 以 用 dict 函数 ， 通 过 其 他 映射 《如 其 他 字典 ) 或 键 / 值 序列 对 建立 字典 ， 例 如 ; 


>>> student=[(name', 小 萌 ),(Cnumber,10019] 
>>> detail=dict(student) 

>>> print( 学 生 详细 信息 : ',detai) 

学 生 详细 信息 : fname': ' 小 萌 ', number': '1001'} 
>>> print( 学 生 姓 名 : ,detail[mame]) 


学 生 姓 名 : 小 萌 
>>> print(' 学 生 学 号 : ,detail[number]) 
学 生 学 号 : 1001 


由 输出 结果 看 到 ，dict 函数 可 以 将 序列 转换 为 字典 。 字 典 的 操作 很 简单 ， 在 5.1 节 期 望 的 
功能 已 经 实现 了 。 

dict 函数 可 以 通过 关键 字 参 数 创建 字典 ， 例 如 : 

>>> detail=dict(name=" 小 智 ,number='1002') 

>>> print(' 学 生 详细 信息 : ',detail) 

学 生 详细 信息 : ”f'name': ' 小 智 , "mumber': '1002'} 


由 输出 结果 看 到 ， 通 过 关键 字 参 数 创建 了 字典 。 

通过 关键 字 创 建 字 典 功能 是 dict 函数 非常 有 用 的 一 个 功能 ， 可 以 多 加 运用 。 
5.2.2 ”字典 的 基本 操作 

字典 的 基本 操作 在 很 多 方面 与 序列 (sequence) 类 似 ， 支 持 修 改 、 删 除 等 操作 。 下 面 进 行 
具体 的 讲解 。 

1. 修改 字典 

向 字典 添加 新 内 容 的 方法 是 增加 新 键 / 值 对 ， 修 改 或 删除 已 有 键 / 值 对 ， 例 如 : 


>>> student=f{' 小 萌 …"1001', 小 智 '*"1002',' 小 强 '*1003'} 
>>> student[' 小 强 ]='1005”# 更 新 小 强 的 学 号 

>>> print( 小 强 的 学 号 是 ，%( 小 强 )s' % student) 

小 强 的 学 号 是 : 1005 

>>> student[' 小 张 ]='1006' # 添 加 一 个 学 生 








>>> print( 小 张 的 学 号 是 : %( 小 张 )s' % student) 
小 张 的 学 号 是 : 1006 


由 输出 结果 看 到 ， 修 改 和 添加 均 操 作成 功 。 
2. 删除 字典 元 素 


此 处 的 删除 指 的 是 显 式 删 除 ， 显 式 删除 一 个 字典 用 del 命令 ， 例 如 : 


>>> student=f 小 强 ': "1005',' 小 萌 ':'1001,' 小 智 : "1002', "小 张 '1006'} 

>>> print( 删 除 前 :',student) 

删除 前 : {' 小 强 ':'1005', "小 萌 "': '1001', "小 智 : 1002', "小 张 ': '1006'} 

>>> del student[' 小 张 ] # 手 除 键 “ 小 张 ” 

>>> print(' 删 除 后 :',student) 

删除 后 : {小 强 ':'1005', "小 萌 ':'1001', "小 智 : '1002'} 

由 输出 结果 看 到 对 应 键 / 值 被 正确 删除 了 。 

除了 删除 键 ， 还 可 以 删除 整个 字典 ， 例 如 : 

>>> student=f 小 强 ': "1005',' 小 萌 ': '1001', "小 智 '1002', "小 张 '1006'} 

>>> print(' 删 除 前 :student) 

删除 前 : f 小强: '1005', ' 小 萌 ' "1001', "小 智 ': "1002', "小 张 ': '1006'} 

>>> del student # 删 除 字 典 

>>> print( 删 除 后 :,student) 

Traceback (most recent call last): 

File "<pyshell#70>", line 1, in <module> 
print(' 删 除 后 :',student) 

NameError: name 'student is not defined 

由 输出 结果 看 到 ， 删 除 字典 后 就 不 能 对 字典 进行 访问 了 ， 因 为 执行 del 操作 后 字典 就 不 存 
在 了 ， 因 而 会 报 变量 没有 定义 的 错误 。 

3. 字典 键 的 特性 

字典 值 可 以 没有 限制 地 取 任 何 Python 对 象 ， 既 可 以 是 标准 对 象 ， 也 可 以 是 用 户 定义 的 对 
象 ， 但 键 不 行 。 

需要 记 住 以 下 两 点 : 

(1) 不 允许 同一 个 键 出 现 两 次 。 创 建 时 如 果 同 一 个 键 被 赋值 两 次 ， 后 面 的 值 会 被 记 住 ， 

例如 : 


>>> student={' 小 戎 ': '1001', "小 智 : '1002', "小 萌 ': '1005'} 
>>> print( 学 生 信息 : ',student) 
学 生 信息 : {小 萌 ':'1005', "小 智 '1002'} 


由 输出 结果 看 到 ， 一 个 键 被 赋值 两 次 ， 后 面 的 值 会 被 记 住 。 
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(2) 键 必须 不 可 变 ， 可 以 用 数字 、 字 符 串 或 元 组 充当 ， 不 能 用 列表 ， 例 如 : 


>>> field={[name]:' 小 萌 ',number:1001? 
Traceback (most recent call last): 

File "<pyshell#80>", line 1, in <module> 

field={['mmame']:" 小 萌 ','number':'1001'} 
TypeError: unhashable type: 'list 


由 输出 结果 看 到 ， 不 能 用 列表 做 键 ， 会 提示 类 型 错误 。 
4. len 函数 
len (dict) 函数 用 于 计算 字典 元 素 的 个 数 ， 即 键 的 总 数 ， 例 如 : 


>>> student=f 小 萌 ': '1001', "小 智 "1002', "小 强 ': "1005', 小 张 '1006'} 
>>> print( 字 典 元 素 个 数 为 : %d 个 ' % len(student)) 
字典 元 素 个 数 为 : 4 个 


输出 结果 得 到 字典 元 素 的 个 数 为 4。 

5. type 函数 

type (variable) 函数 返回 输入 的 变量 类 型 ， 如 果 输 入 变量 是 字典 就 返回 字典 类 型 ， 例 如 : 
>>> student={f 小 萌 ': '1001', "小 智 : '1002', 小强: '1005', 小 张 ': '1006'} 

>>> print(' 字 典 的 类 型 为 : ,type(student) 

字典 的 类 型 为 : <class 'dict> 

输出 结果 为 字典 〈dict) 类 型 。 

5.2.3 ”字典 的 格式 化 字符 串 


在 第 4 章 我 们 已 经 见 过 如 何 使 用 字符 串 格式 化 功能 格式 化 元 组 中 的 所 有 值 。 如 果 使 用 字 
典 〈 只 以 字符 串 作 为 键 》 而 不 是 元 组 做 这 项 工作 ， 会 使 字符 串 格式 化 更 有 趣 一 些 ， 例 如 : 
>>> student=f 小 萌 '"1001" 小 智 '"1002', 小 强 '"10034 

>>> print( 小 强 的 学 号 是 ，%( 小 强 )s' % student) 

小 强 的 学 号 是 : 1003 


由 操作 结果 看 到 , 字典 的 格式 化 方式 是 在 每 个 转换 说 明 符 中 的 % 字 符 后 加 上 用 圆 括号 括 起 
来 的 键 ， 再 跟 上 其 他 说 明 元 素 。 

字典 的 格式 化 除了 增加 字符 串 键 外 ， 转 换 说 明 符 还 像 以 前 一 样 工作 。 以 这 种 方式 使 用 字 
典 时 ， 只 要 所 有 给 出 的 键 都 能 在 字典 中 找到 ， 就 可 以 获得 任意 数量 的 转换 说 明 符 。 

5.2.4 字典 和 列表 的 区 别 


例如 ， 以 一 个 名 字 查 找 对 应 的 学 号 。 
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如 果 用 list 实现 ， 就 要 先 在 名 字 列 表 中 找到 对 应 的 名 字 ， 再 从 学 号 列表 取出 对 应 的 学 号 ， 
list 越 长 耗 时 越 长 。 如 果 用 dict 实现 ， 只 需要 一 个 名 字 和 学 号 的 对 照 表 ， 就 可 以 直接 根据 名 字 
查找 学 号 ， 无 论 这 个 表 有 多 大 ， 查 找 速度 都 不 会 变 慢 。 
为 什么 dict 查找 速度 这 么 快 ? 
因为 dict 的 实现 原理 和 查 字 典 一 样 。 假 设 字典 包含 10000 个 汉字 ， 我 们 要 查 某 一 个 字 ， 

-种 方法 是 把 字典 从 第 一 页 往 后 翻 , 直到 找到 我 们 想 要 的 字 为 止 ， 这 种 方法 是 在 list 中 查找 元 

素 ，list 越 大 查找 越 慢 。 另 一 种 方法 是 在 字典 的 索引 表 里 〈 如 部 首 表 ) 查 这 个 字 对 应 的 页 码 ， 
然后 直接 翻 到 该 页 找到 这 个 字 。 无 论 找 哪个 字 , 这 种 查找 速度 都 非常 快 ， 不 会 随 着 字典 大 小 的 
增加 而 变 慢 。 

dict 就 是 第 二 种 实现 方法 ， 给 定 一 个 名 字 ， 比 如 我 们 要 查找 5.2.3 小 节 示 例 中 “小 萌 ” 的 
学 号 ， 在 dict 内 部 就 可 以 直接 计算 出 “小 萌 ” 存 放学 号 的 “页 码 ”， 也 就 是 1001 存放 的 内 存 
地 址 ， 直 接 取出 来 即 可 ， 所 以 速度 非常 快 。 

综 上 所 述 ，list 和 dict 各 有 以 下 几 个 特点 : 


dict 的 特点 是 : 

(1) 查找 和 插入 的 速度 极 快 ， 不 会 随 着 key 的 增加 而 变 慢 。 

(2) 需要 占用 大 量 内 存 ， 内 存 浪费 多 。 

list 的 特点 是 : 

(1) 查找 和 插入 时 间 随 着 元 素 的 增加 而 增加 。 

(2) 占用 空间 小 ， 浪 费 内 存 很 少 。 

所 以 ，dict 是 使 用 空间 换取 时 间 。 

dict 可 以 用 在 很 多 需要 高 速 查找 的 地 方 ， 在 Python 代码 中 几乎 无 处 不 在 ， 正 确 使 用 dict 
非常 重要 ， 需 要 牢记 dict 的 键 必须 是 不 可 变 对 象 。 











(7 dict 内 部 存放 的 顺序 和 键 放 入 的 顺序 没有 关系 。 
注 意 


5.3 字典 方法 


像 其 他 内 建 类 型 一 样 ， 字 典 也 有 方法 ， 这 些 方法 非常 有 用 ， 不 过 可 能 不 像 使 用 列表 或 字 
符 串 一 样 频繁 使 用 。 学 习 本 节 时 可 以 先 简单 浏览 了 解 一 下 有 哪些 方法 可 以 使 用 , 然后 在 需要 时 
回 过 头 来 查看 特定 方法 的 具体 用 法 。 


5.3.1 clear() 方 法 


clear() 方 法 用 于 删除 字典 内 的 所 有 项 。 
clear() 方 法 的 语法 如 下 : 


dict.clear() 
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此 语法 中 dict 代表 指定 字典 , 该 方法 不 需要 参数 .该 函数 是 一 个 原 地 操作 (类 似 于 list.sort) 
函数 ， 没 有 任何 返回 值 (返回 值 为 None) 。 

该 方法 使 用 示例 如 下 : 

>>> student={' 小 萌 ': '1001', "小 智 : '1002', 小强: '1005', 小 张 : '1006'} 

>>> print(' 字 典 元 素 个 数 为 : %d 个 ' % len(student)) 

字典 元 素 个 数 为 : 4 个 

>>> student.clear() 

>>> print( 字 典 删除 后 元 素 个 数 为 : %d 个 ' % len(student)) 

字典 删除 后 元 素 个 数 为 : 0 个 


由 输出 结果 可 知 ， 字 典 调用 clear 方法 后 整个 字典 内 所 有 项 都 被 删除 。 
下 面 看 两 个 示例 。 


示例 1: 


>>> x={ } 

>>>y=x 

>>> x['key']='value' 
>>> 

{'key': 'value'} 

>>> x={ } 

>>> y 

{'key': 'value'} 


示例 2: 


>>x={} 

>>y=x 

>>> x['key']='value’ 
>>>y 

{'key': 'value'} 

>>> x.clear() 
>>>y 


0 


两 个 示例 中 ，x 和 y 最 初 对 应 同一 个 字典 。 示 例 1 中 ,通过 将 x 关联 到 一 个 新 的 空 字典 对 
它 重新 赋值 ， 这 对 y 没有 任何 影响 ,还 关联 到 原先 的 字典 。 若 想 清空 原始 字典 中 所 有 元 素 ， 则 
必须 使 用 clear 方法 ， 使 用 clear 后 ，y 的 值 也 被 清空 了 。 


5.3.2 copy() 方 法 


copy() 方 法 返回 一 个 具有 相同 键 / 值 对 的 新 字典 。 这 个 方法 是 浅 复制 (shallow copy) ， 因 
为 值 本 身 是 相同 的 ， 而 不 是 副本 。 
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copy() 方 法 的 语法 如 下 : 
dict.copy() 


此 语法 中 dict 代表 指定 字典 ， 该 方法 不 需要 参数 。 返 回 结 果 为 一 个 字典 的 浅 复制 。 
该 方法 使 用 示例 如 下 : 


>>> student=f 小 萌 ': '1001', "小 智 : '1002', "小 强 ': "1005', 小 张 ': '1006'} 

>>> st=student.copy() 

>>> print( 复 制 后 得 到 的 st 为 : "st) 

复制 后 得 到 的 st 为 : {小强 ':'1005', "小 萌 : "1001', "小 智 : '1002', "小 张 '1006'} 

由 输出 结果 看 到 ， 使 用 copy 方法 可 以 将 字典 复制 给 另 一 个 变量 。 

我 们 可 以 通过 下 面 的 示例 了 解 什么 是 浅 复制 。 

>>> student=f 小 智 :1002,'info':[ 小 张 "1006wman]} 

>>> st=student.copy() 

>>> st 小 智 ]='1005' 

>>> print( 更 改 copy 后 的 st 为 : "sb 

更 改 copy 后 的 st 为: frinfo': [' 小 张 ,'1006','man'],' 小 智 :'1005'} 

>>> print( 原 字符 串 为 : : "studenb 

原 字 符 串 为 :: finfo': [' 小 张 ,'1006, "man], "小 智 : '1002'} 

>>> st['info'].remove('man') 

>>> print( 删 除 后 st 为 : ',st) 

删除 后 st 为 : 《finfo': [小 张 , '1006"], ' 小 智 :'1005'} 

>>> print( 删 除 后 student 为 : "student) 

删除 后 student 为 : finfo': [" 小 张 ,'10061, "小 智 : "1002'} 

由 输出 结果 看 到 ， 蔡 换 副 本 的 值 时 原始 字典 不 受 影响 。 如 果 修 改 了 某 个 值 〈 原 地 修改 ， 
不 是 替换 ) ， 原 始 字典 就 会 改变 ， 因 为 同样 的 值 也 在 原 字典 中 。 以 这 种 方式 进行 复制 就 是 浅 复 
制 ， 而 使 用 深 复 制 (deep copy) 可 以 避免 该 问题 ， 此 处 不 做 讲解 ， 有 兴趣 的 读者 可 以 自己 查 
找 相 关 资 料 。 


5.3.3 ”fromkeys() 方 法 


fromkeys() 方 法 用 于 创建 一 个 新 字典 ， 以 序列 seq 中 的 元 素 做 字典 的 键 ，value 为 字典 所 有 
键 对 应 的 初始 值 。 

fromkeys() 方 法 的 语法 如 下 : 

dict.fromkeys(seq[, value])) 

此 语法 中 dict 代表 指定 字典 ，seq 代表 字典 键 值 列表 ;value 代表 可 选 参数 ， 设 置 键 序列 
(seq) 的 值 。 该 方法 返回 结果 为 列表 。 
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该 方法 使 用 示例 如 下 : 


>>> seq = (name', 'age', 'sex') 

>>> info = dict.fromkeys(seq) 

>>> print ("新 的 字典 为 : %s" % info) 

新 的 字典 为 : {f'name': None, 'sex': None, 'age': None} 
>>> info = dict.fromkeys(seq, 10) 

>>> print ("新 的 字典 为 : %s" % info) 

新 的 字典 为 : fname': 10, 'sex': 10, 'age': 10} 


由 输出 结果 看 出 , fromkeys 方法 使 用 给 定 的 键 建立 新 字典 , 每 个 键 默认 对 应 的 值 为 None。 


5.3.4 get() 方 法 


get() 方 法 返回 指定 键 的 值 ， 如 果 值 不 在 字典 中 ， 就 返回 默认 值 。 
get() 方 法 的 语法 如 下 : 


dict.get(key, default=None) 
此 语法 中 dict 代表 指定 字典 ，key 代表 字典 中 要 查找 的 键 ，default 代表 指定 键 的 值 不 存在 


时 返回 默认 值 。 该 方法 返回 结果 为 指定 键 的 值 ， 如 果 值 不 在 字典 中 ， 就 返回 默认 值 None。 





使 月 





该 方法 使 用 示例 如 下 : 

>>> student=f{' 小 萌 ': '1001', "小 智 : '1002'} 

>>> print (小 萌 的 学 号 为 : %s' % student.get(' 小 萌 )) 
小 萌 的 学 号 为 : 1001 


由 输出 结果 看 到 ，get 方法 使 用 起 来 比较 简单 。 再 看 如 下 示例 : 


>>> st={} 
>>> print(st[mame']) 
Traceback (most recent call last): 
File "<pyshell#166>", line 1, in <module> 
print(st['name']) 
KeyError: name’ 
>>> print(st.get(‘name')) 
None 
>>> print(name 的 值 为 : %s' % stget(name)) 
name 的 值 为 : None 


由 输出 结果 看 到 ， 其 他 方法 试图 访问 字典 中 不 存在 的 项 时 会 出 错 ， 而 使 用 get 方法 就 不 会 。 





日 get 方法 访问 一 个 不 存在 的 键 时 , 返回 None。 这 里 可 以 自 定义 默认 值 , 用 于 替换 None, 例如 : 


>>> st={} 
>>> print(name 的 值 为 : %s' % st.get(name',' 未 指定 ')) 
name 的 值 为 : 未 指定 
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由 输出 结果 看 到 ， 输 出 结果 中 用 “未 指定 ”替代 了 None。 
5.3.5 ”key in dict 方法 


Python 字典 in 操作 符 用 于 判断 键 是 否 存在 于 字典 中 ， 如 果 键 在 字典 dict 中 就 返回 true， 
否则 返回 false。 
该 方法 的 语法 如 下 : 


key in dict 


此 语法 中 dict 代表 指定 字典 , key 代表 要 在 字典 中 查找 的 键 。 如 果 键 在 字典 里 就 返回 true， 
否则 返回 false。 

该 方法 使 用 示例 如 下 : 

>>> student=f 小 萌 : 1004', "小 智 : 1002'} 

>>> print(' 小 萌 在 student 字典 中 : %s'%(' 小 萌 'in student)) 

小 萌 在 student 字典 中 :True 

>>> print(' 小 强 在 student 字典 中 : %s'%(' 小 强 'in student)) 

小 强 在 student 字典 中 : False 


由 输出 结果 看 到 ， 已 返回 对 应 的 True 或 False。 
该 方法 是 Python 3 中 的 方法 。 在 Python 2 中 有 一 个 有 相同 功能 的 方法 一 一 has_key 方法 ， 
has_key 方法 的 使 用 方式 和 in 不同。 


5.3.6 items() 方 法 


items() 方 法 以 列表 返回 可 遍历 的 〈 键 , 值 ) 元 组 数组 。 
items() 方 法 的 语法 如 下 : 











dict.items() 

此 语法 中 dict 代表 指定 字典 ， 该 方法 不 需要 参数 。 返 回 结果 为 可 遍历 的 〈 键 / 值 ) 元 组 数组 。 

该 方法 使 用 示例 如 下 : 

>>> student=f 小 萌 ': '1001', "小 智 : '1002'} 

>>> print( 调 用 items 方法 的 结果 : %s'% student.items()) 

调用 items 方法 的 结果 : dict_items([( 小 萌 ,'1001). (小 智 , '1002")]) 

由 输出 结果 看 到 ， 返 回 结果 为 一 个 元 组 数组 。 

在 Python 2 中 提供 了 一 个 iteritems 方法 ， 该 方法 和 items 方法 的 作用 大 致 相同 ， 但 是 
iteritems 方法 返回 的 是 一 个 迭代 器 对 象 ， 而 不 是 列表 。 在 Python 3 中 没有 iteritems 方法 。 
5.3.7 ”keys() 方 法 


keys() 方 法 以 列表 返回 一 个 字典 所 有 键 。 
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keys() 方 法 的 语法 如 下 : 
dict.keys() 


此 语法 中 dict 代表 指定 字典 ， 该 方法 不 需要 参数 。 返 回 结果 为 一 个 字典 所 有 键 。 
该 方法 使 用 示例 如 下 : 

>>> student={f 小 萌 ': '1001', ' 小 智 : '1002'} 

>>> print( 字 典 student 所 有 键 为 : %s'% student.keys()) 

字典 student 所 有 键 为 : dict_keys([ 小 萌 ', ' 小 智 ]) 


由 输出 结果 看 到 ， 返 回 的 是 一 个 元 组 数组 ， 数 组 中 包含 字典 所 有 键 。 
5.3.8 ”setdefault() 方 法 


setdefault() 方 法 和 get() 方 法 类 似 , 用 于 获得 与 给 定 键 相 关联 的 值 。 如 果 键 不 存在 于 字典 中 ， 
就 会 添加 键 并 将 值 设 为 默认 值 。 
setdefault() 方 法 的 语法 如 下 : 


dict.setdefault(key, default=None) 


此 语法 中 dict 代表 指定 字典 ，key 代表 查找 的 键 值 ，default 代表 键 不 存在 时 设置 的 默认 键 
值 。 该 方法 没有 任何 返回 值 。 

该 方法 使 用 示例 如 下 : 

>>> student={' 小 朝 : 1001', "小 智 : 1002'} 

>>> print(' 小 强 的 键 值 为 ，%s'% student setdefault(' 小 强 )) 

小 强 的 键 值 为 : None 

>>> print( 小 智 的 键 值 为 : %s'% student setdefault(' 小 智 )) 

小 智 的 键 值 为 ， 1002 

>>> print(student 字典 新 值 为 : %s'% student) 

student 字典 新 值 为 :{' 小 强 ': None, ' 小 萌 ': '1001', 小 智 : '1002'} 


由 输出 结果 看 到 ， 当 键 不 存在 时 ，setdefault 方法 返回 默认 值 并 更 新 字典 ; 如 果 键 存在 ， 
就 返回 与 其 对 应 的 值 ， 不 改变 字典 。 和 get 一 样 ， 默 认 值 可 以 选择 ， 如 果 不 设 定 就 使 用 None， 
如 果 设 定 就 使 用 设 定 的 值 ， 例 如 : 

>>> student={f 小 萌 ': "1001,' 小 智 : '1002'} 

>>> print(' 小 强 的 键 值 为 ，%s'% student.setdefault(' 小 强 ')) 

小 强 的 键 值 为 : None 

>>> print( 小 zhang 的 键 值 为 : %s'% student.setdefault(' 小 zhang','1006')) 

小 zhang 的 键 值 为 : 1006 


由 输出 结果 看 到 ， 小 强 没 有 设置 值 ， 使 用 的 是 默认 值 ， 输 出 键 值 为 None; 小 zhang 设置 
的 默认 值 是 1006， 输 出 键 值 为 1006。 
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5.3.9 update() 方 法 


update() 方 法 用 于 把 字典 dict2 的 键 / 值 对 更 新 到 dict 里 。 
update() 方 法 的 语法 如 下 : 


dictupdate(dict2) 


此 语法 中 dict 代表 指定 字典 ，dict2 代表 添加 到 指定 字典 dict 里 的 字典 。 该 方法 没有 任何 
返回 值 。 
该 方法 使 用 示例 如 下 : 


>>> student={" 小 萌 ': '1001', "小 智 '1002'} 

>>> student2={f 小 李 ':"1003'} 

>>> print( 原 student 字典 为 : %s'% student) 

原 student 字典 为 :小 萌 ':'1001', "小 智 :'1002'} 

>>> student.update(student?2) 

>>> print( 新 student 字典 为 : %s'% student) 

新 student 字典 为 :{' 小 李 ':'1003', "小 萌 '1001', "小 智 '1002} 
>>> student3={' 小 李 ':'1005'} 

>>> student.update(student3) # 对 相同 项 覆盖 

>>> print(' 新 student 字典 为 : %s'% student) 

新 student 字典 为 :{' 小 李 ':'1005', ' 小 萌 : "1001', ,小 智 :10024 


由 输出 结果 看 到 ， 提 供 的 字典 中 的 项 被 添加 到 旧 字典 中 ， 如 果 有 相同 的 键 就 会 覆盖 。 
5.3.10 ”values() 方 法 

values() 方 法 以 列表 形式 返回 字典 中 所 有 值 。 与 返回 键 的 列表 不 同 ， 返 回 的 列表 中 可 以 包 
含 重复 的 元 素 。 

values() 方 法 的 语法 如 下 : 








dict.values() 
此 语法 中 dict 代表 指定 字典 ， 该 方法 不 需要 参数 。 返 回 结果 为 字典 中 的 所 有 值 。 
该 方法 使 用 示例 如 下 : 


>>> student={ 小 萌 ': '1001', "小 智 : '1002', 小 李 ":'1001'} 
>>> print('student 字典 所 有 值 为 : %s'% list(student.values())) 
student 字典 所 有 值 为 : [1001', '1001', '10021] 


由 输出 结果 看 到 ， 返 回 的 列表 中 包含 重复 的 元 素 。 
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5.4 调 试 


下 面 我 们 通过 示例 进行 介绍 ， 这 里 通过 设置 一 些 错 误 让 读者 认识 在 编写 代码 过 程 中 的 常 
见 问题 ， 以 帮助 读者 熟悉 和 解决 实际 遇 到 的 问题 。 

(1) 使 用 列表 根据 姓名 查找 学 号 ， 学 号 使 用 字符 串 表 示 ， 如 果 更 改 为 使 用 数字 表示 会 如 
何 ? 例如: 

>>> students=[' 小 萌 ',' 小 智 ' 小 强 ', 小 张 , 小 李 '] 

>>> numbers=[1001,1002,1003,1004,1005] 

>>> print( 小 智 的 学 号 是 :',numbers[students.index(' 小 智 )]) 

小 智 的 学 号 是 : 1002 

输出 结果 和 使 用 字符 串 表示 的 输出 结果 没有 什么 不 同 。 不 过 这 里 数字 都 是 以 1 开头 ， 若 
把 1 更 改 为 0， 我 们 试 试 : 

>>> students=[" 小 萌 ' 小 智 " 小 强 '" 小 张 " 小 李 '] 

>>> numbers=[0001,0002,0003,0004,0005] 

SyntaxError invalid token 

可 以 看 出 ，numbers 的 编译 不 让 通过 ， 告 诉 我 们 这 是 一 个 无 效 标记 。 这 就 是 不 使 用 数字 而 
使 用 字符 串 的 原因 ， 使 用 数字 碰 到 以 0 开头 的 数字 就 会 出 现 问题 。 

(2) 尝试 从 字典 中 输出 一 个 字符 宽度 为 10 的 元 素 ? 例如 : 

>>> student={' 小 萌 "1001',' 小 智 "1002', 小 强 '*1003'} 

>>> print( 小 萌 的 学 号 是 : %( 小 萌 )10s' % student) # 字 符 宽度 为 10 

小 萌 的 学 号 是 : 1001 


尝试 把 10s 变换 为 10d、10f、-10s、+10s， 看 看 输出 结果 是 怎样 的 。 
5.5 ”问题 解答 


(1) 在 项 目 实战 中 字典 用 得 多 吗 ? 

答 : 实际 项 目 中 字典 用 得 比较 多 。 通 过 本 章 的 学 习 我 们 知道 ， 字 典 能 存储 键 / 值 对 信息 
当 遇 到 需要 通过 一 个 值 取得 另 一 个 值 时 ,字典 就 是 一 个 很 好 的 选择 。 特别 在 项 目 中 ， 需 要 根据 
唯一 标识 〈 如 id) 取得 统计 值 的 情况 很 多 ， 就 需要 字典 结构 的 支持 。 

(2) 在 哪些 领域 使 用 字典 比较 多 ? 

答 : 基本 需要 使 用 软件 的 领域 都 会 使 用 字典 结构 ， 毕 竟 这 是 一 个 基本 数据 结构 。 
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(3) 其 他 语言 中 有 字典 的 说 法 吗 ? 
答 : 有 。 字 典 这 种 数据 结构 在 任何 编程 语言 中 都 有 ， 不 过 在 不 同 语言 中 定义 的 方式 不 太 
一 样 ， 如 在 Java 中 用 map 表示 字典 。 


5.6 温 故 知 新 ， 学 以 致 用 


本 章 主 要 讲解 了 字典 ， 在 本 章 结 束 前 回顾 一 下 学 到 的 概念 。 


(1) 字典 如 何 使 用 ? 
(2) 如 何 创建 字典 ， 字 典 有 哪些 基本 操作 ? 
(3) 字典 常用 的 方法 有 哪些 ， 该 怎么 使 用 ? 


尝试 思考 并 解决 如 下 问题 : 


(1) 用 dict 函数 实现 存储 一 个 人 的 姓名 、 手 机 号 和 地 址 信息 ， 字 符 串 名 称 和 值 由 自己 定 
义 和 赋 值 。 

(2) 创建 一 个 字典 ， 里 面 元 素 的 键 / 值 全 部 为 字符 串 ， 然 后 更 改 某 个 元 素 ， 更 改 其 值 为 非 
字符 串 形式 ， 如 整数 、 浮 点 数 或 元 组 。 
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学 习 了 Python 的 一 些 基本 概念 和 数据 结构 ， 相 信 你 已 
经 有 一 定 基础 了 。 

本 章 将 会 从 import 语句 开始 逐步 深入 介绍 条 件 语句 、 循 
环 语句 以 及 列表 推导 式 等 一 些 更 深层 次 的 语句 。 
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6.1 ”使 用 文本 编辑 器 


到 目前 为 止 , 我 们 都 是 在 Python 的 交互 式 命令 行 下 操作 的 ,优点 是 能 很 快 得 到 操作 结果 ， 不 

过 缺点 也 很 明显 ， 就 是 没 法 保存 操作 记录 。 如 果 下 次 还 想 运行 已 经 编写 过 的 程序 ， 就 得 重新 编写 
- 遍 。 更 重要 的 一 点 是 ， 稍 微 复杂 的 程序 使 用 交互 命令 行 操作 起 来 就 会 很 复杂 。 在 实际 开发 时 ， 
可 以 使 用 文本 编辑 器 编写 复杂 的 代码 ， 写 完 后 可 以 保存 为 一 个 文件 ， 程 序 也 可 以 反复 运行 。 

这 里 推荐 两 款 文本 编辑 器 : 一 款 是 Sublime Text， 可 以 免费 使 用 ， 但 是 不 付费 会 弹出 提示 
框 ， 使 用 界面 如 图 6-1 所 示 ; 另 一 款 是 Notepad++， 也 可 以 免费 使 用 ， 可 根据 自己 的 需要 选择 
中 文 版 和 英文 版 ， 使 用 界面 如 图 6-2 所 示 。 

加 Di\python\workspace\hello.py * sublime Text 2 (UNRECISTERED 0 le EE 








File Edit Selection Find View Goto Tools Project Preferences Help 





图 6-1 Sublime Text 编辑 器 


| Di:\python\workspace\hello.py - Notepad++ 
文件 日” 蝙 贺 (E) 搜索 (S$) 视图 (V) 格式 (M) 语言 () 设置 中 宏 (Q) 运行 (8) 插件 BP) 罕 DW) 
o 轨 四 居 015 全 | 省 多 上 胜 | 3 的 二 | 记忆 国 1 国 oD 





sl Mllo. py 
< Print ("Hello,world!') 





图 6-2 ”Notepad++ 编 辑 器 
以 上 两 个 编辑 器 使 用 哪 一 个 都 可 以 , 笔者 使 用 的 是 Notepad++ 编 辑 器 ， 后 面 的 示例 若 没 有 
特殊 说 明 ， 指 的 就 是 在 Notepad++ 编 辑 器 下 操作 。 
绝对 不 能 使 用 Word 和 Windows 自 带 的 记事 本 。Word 保存 的 不 是 纯 文本 文件 , 而 记事 本 
坪 会 自动 在 文件 开始 的 地 方 加 上 几 个 特殊 字符 (UTF-8 BOM ) ， 从 而 导致 程序 运行 时 出 现 
提 示 莫名 其 妙 的 错误 。 
安装 好 文本 编辑 器 后 ， 打 开 编 辑 器 ， 输 入 以 下 代码 : 
print(Hello,world!) 
print 前 面 不 要 有 任何 空格 。 
注 意 
输入 完成 后 ， 将 文本 保存 到 指定 目录 〈 如 D:\python\workspace) ， 保 存 文 件 名 为 hello.py 


(文件 的 命名 随 自 己 的 喜好 ， 但 一 定 要 以 .py 结尾 ) 。 文 件 名 只 能 是 英文 字母 、 数 字 和 下 划 线 
的 组 合 。 建 议 文件 名 有 一 定 意义 ， 方 便 记 忆 和 日 后 查看 。 
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打开 命令 行 窗 口 ( 如 在 Windows 中 打开 cmd 命令 窗口 ) ， 把 当前 目录 切换 到 hello.py 所 
在 的 目录 ， 如 图 6-3 所 示 。 


画 C\Windows\system32\cmd. exe 


soft Windows [版 本 6.1.76811 有 
并 有 《c》 2989 Microsoft Corporation。 保 留 所 有 权利 








pas 


C: Users\lyz> 
C: Wsers\lyz)d: 


Dp: Ycd python 

ip: \pythonycd workspace 

n\workspace>dir 
中 的 卷 是 新 加 郑 
是 683F-8B?9 


三 


2816/88/38 22:21 <DIR> 

12616/88/38 22:21 <DIR> 于 

2816/88/38 22:81 21 hello.py 
1 个 文 字 节 


件 21 字 人 P 
2 个 目录 93.578.289.664 可 用 字 节 


ID: \pyt hon workspace> 





6-3 ”切换 到 hello.py 所 在 的 目录 
切换 到 workspace 目录 下 ， 输 入 dir 命令 ,查看 该 文件 夹 中 有 哪些 文件 。 当 前 窗口 中 该 文 
件 夹 下 有 一 个 名 为 hello.py 的 文件 。 接 下 来 在 cmd 命令 窗口 输入 python hello.py 命令 运行 
hello.py， 如 图 6-4 所 示 。 


D: pythonsworkspace>python hello.py 
hello .worlad? 





ip: \python \workspace> 


6-4 输入 命令 执行 hello.py 文件 


在 cmd 命令 窗口 中 执行 Python 文件 的 命令 格式 为 : 

python 带 py 后 级 的 文件 名 ， 如 hello.py 

输入 命令 后 按 enter 键 ， 即 可 在 cmd 命令 窗口 输出 结果 ， 如 示例 中 的 “Hello,world!”。 

如 果 输 入 执行 的 文件 不 存在 就 会 报错 ， 如 果 在 上 面 的 示例 中 输入 python hi.py，cmd 命令 
窗口 就 会 输出 如 下 错误 : 

D:\python\workspace>python hi.py 

python: can't open file 'hi.py': [Errno 2] No such file or directory 

该 错误 信息 的 意思 是 ， 无 法 打开 hi.py 文件 ， 没 有 这 个 文件 或 目录 。 如 果 在 操作 中 看 到 类 
似 错误 ， 就 需要 查看 当前 目录 下 是 否 有 这 个 文件 ， 如 用 dir 命令 查看 当前 文件 夹 下 是 否 有 对 应 
文件 。 如 果 文 件 存放 在 另 一 个 目录 下 ， 就 要 用 cd 命令 切换 到 对 应 目录 。 
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6.2 import 的 使 用 


语言 的 学 习 只 有 在 不 断 深入 后 才能 进一步 发 现 其 中 隐藏 的 惊人 特性 ， 即 使 是 简单 的 print 
函数 ， 在 不 断 使 用 后 也 会 发 现 更 多 使 用 方式 ，import 将 带 你 进入 一 个 更 快捷 的 编程 模式 。 


6.2.1 import 语句 
在 讲解 import 语句 之 前 先 看 一 个 示例 : 
import math 


=5 


print(' 半 径 为 5 的 圆 的 面积 为 : %.2f %(math.pi*r**2)) 
保存 文件 名 为 import_test.py。 在 cmd 命令 窗口 执行 如 下 命令 : 


D:\python\workspace>python import_test.py 

半径 为 5 的 圆 的 面积 为 : 78.54 

上 面 的 程序 使 用 了 import 语句 。 

import math 的 意思 为 从 Python 标准 库 中 引入 math.py 模块 ， 这 是 Python 中 定义 的 引入 模 
块 的 方法 。import 的 标准 语法 如 下 : 

import modulel[, module2[,... moduleN]] 

表示 人 允许 一 个 import 导入 多 个 模块 ， 但 各 个 模块 间 需 要 用 逗号 隔 开 。 

当 解 释 器 遇 到 import 语句 时 ， 如 果 模 块 在 当前 搜索 路 径 就 会 被 导入 。 搜 索 路 径 是 一 个 解 
释 器 ， 会 先 搜索 所 有 目录 的 列表 。 

当 我 们 使 用 import 语句 时 ，Python 解释 器 怎样 找到 对 应 的 文件 呢 ? 这 涉及 Python 的 搜索 
路 径 ， 搜 索 路 径 由 一 系列 目录 名 组 成 ，Python 解释 器 会 依次 从 这 些 目录 中 寻找 引入 的 模块 。 
看 起 来 很 像 环 境 变量 ， 事 实 上 可 以 通过 定义 环境 变量 的 方式 确定 搜索 路 径 。 搜 索 路 径 是 在 
Python 编译 或 安装 时 确定 的 ， 被 存储 在 sys 模块 的 path 变量 中 。 查 看 搜索 路 径 的 方式 如 下 : 

import sys 


print(Python 的 搜索 路 径 为 : %s' % sys.path) 
保存 文件 名 为 import_sys.py， 在 cmd 命令 窗口 执行 结果 如 下 : 


D:\python\workspace>python import_sys.py 

Python 的 搜索 路 径 为 : ['D:\python\\workspace', 'E:\\python\\pythoninstall\python 

35.zip', 'E:\python\pythoninstal \DLLs', 'E:\\python\pythoninstall\lib’, 'E:\\python\\pythoninstall,, 
'E:\python\pythoninstall\lib\\site-packages'] 
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由 以 上 输出 结果 看 到 ，sys.path 输出 了 一 个 列表 ， 第 一 项 输出 的 是 执行 文件 所 在 的 目录 ， 
即 我 们 执行 Python 解释 器 的 目录 (如 果 是 脚本 ， 就 是 运行 脚本 所 在 的 目录 〉。 

了 解 搜索 路 径 的 概念 后 ， 可 以 在 脚本 中 修改 sys.path 引入 一 些 不 在 搜索 路 径 中 的 模块 。 

上 面 我 们 初步 引入 了 import 语句 , 除了 用 import 引入 模块 外 , 还 有 另 一 种 方式 引入 模块 ， 
先 看 交互 模式 下 输入 的 示例 : 

>>> from math import pi 

>>> print (pi) 

3.141592653589793 

上 面 的 操作 使 用 了 from math import pi 的 方式 ， 这 是 什么 意思 

在 Python 中 ，from ee a apt i 语法 如 下 : 


from modname import namel[, name2[, ... nameN]] 


例如 ，from math import pi 语句 就 是 从 math 模块 中 导入 pi 到 当前 命名 空间 ， 该 语句 不 会 
将 math 整个 模块 导入 。 比 如 在 math 模块 中 还 有 sin、exp 函数 ， 在 这 个 语句 里 这 两 个 函数 都 
使 用 不 了 ， 而 在 导入 整个 math 模块 的 语句 中 可 以 使 用 。 在 交互 模式 下 输入 : 


>>> import math 
>>> print(math.pi) #math.pi 可 以 被 输出 
3.141592653589793 
>>> print(math.sin(1)) #math.sin(1) 可 以 被 输出 
0.8414709848078965 
>>> print(math.exp(1)) #math.exp(1) 可 以 被 输出 
2.718281828459045 
>>> from math import pi 
>>> print (pi) #pi 可 以 被 输出 
3.141592653589793 
>>> print(sin(1)) #sin(1) 不 可 以 被 输出 
Traceback (most recent call last): 

File "<pyshell#51>", line 1, in <module> 


Print(sin(1)) 
NameError: name 'sin' is not defined 
>>> print(exp(1)) #exp(1) 不 可 以 被 输出 


Traceback (most recent call last): 
File "<pyshell#52>", line 1, in <module> 
print(exp(1)) 
NameError: name 'exp' is not defined 
由 以 上 输出 结果 可 知 ， 如 果 导 入 模块 ， 就 会 得 到 模块 中 所 有 对 象 ， 如 果 指 定 导入 某 个 对 
象 ， 就 只 能 得 到 该 对 象 。 
这 样 做 的 好 处 是 什么 呢 ? 先 看 如 下 示例 : 
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>>> import math 

>>> print(math.pi) 

3.141592653589793 

>>> print(pi) 

Traceback (most recent call last): 

File "<pyshell#3>", line 1, in <module> 
Print(pi) 

NameError: name 'pi' is not defined 

>>> from math import pi 

>>> print(pi) 

3.141592653589793 

由 上 面 的 输出 结果 可 知 ， 如 果 在 导入 math 模块 时 访问 pi 对 象 ， 需 要 使 用 math.pi， 直 接 
使 用 pi 访问 不 了 ， 会 报错 。 使 用 import 语句 后 ， 可 以 直接 访问 pi 对 象 ， 不 需要 加 上 模块 名 进 
行 访问 。 

如 果 要 访问 模块 中 多 个 对 象 , 是 否 需要 一 个 一 个 导入 呢 ? 如 果 要 访问 math 中 的 pi 和 sin， 
是 否 要 写 两 个 from math import 语句 ?例如 : 


from math import pi 
from math import sin 


当然 不 用 ， 可 以 直接 使 用 如 下 语句 : 
from math import pi,sin 


可 以 从 一 个 导入 语句 导入 多 个 函数 ， 多 个 函数 之 间 用 逗号 分 割 。 
如 果 要 访问 模块 中 多 个 对 象 ， 是 否 需 要 一 个 一 个 导入 呢 ? 当然 不 用 ， 可 以 直接 使 用 如 下 
语句 : 


from math import * 


使 用 该 语句 可 以 将 math 中 所 有 对 象 都 引入 ， 比 如 上 面 几 个 报错 的 情况 就 可 以 成 功 输出 结 
果 了 ， 例 如 : 

>>> from math import * 

>>> print(pi) #pi 可 以 被 输出 

3.141592653589793 

>>> print(sin(1)) #sin(1) 可 以 被 输出 

0.8414709848078965 

>>> print(exp(1)) #exp(1) 可 以 被 输出 

2.718281828459045 


由 输出 结果 看 到 ，pi、sin、exp 等 函数 都 可 以 被 正确 输出 了 。 这 是 一 个 简单 地 将 项 目 中 所 
有 模块 都 导入 的 方法 。 在 实际 开发 中 ， 这 种 声明 不 建议 过 多 使 用 ， 这 样 不 利于 编写 清晰 、 简 单 
的 代码 。 只 有 想 从 给 定 模块 导入 所 有 功能 时 才 使 用 这 种 方式 。 
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除了 上 述 几 种 方式 外 ， 还 可 以 为 模块 取 别名 ， 例 如 : 


>>> import math as m 
>>> m.pi 
3.141592653589793 


由 输出 结果 看 到 ， 给 模块 取 别 名 的 方式 为 : 在 导出 模块 的 语句 末尾 增加 一 个 as 子 名 ，as 
后 面 跟 上 别名 名 称 。 
既然 可 以 为 模块 取 别 名 ， 当 然 也 可 以 为 函数 取 别 名 ， 例 如 : 


>>> from math import pi as p 
>>> p 
3.141592653589793 


由 输出 结果 可 知 ， 我 们 为 pi 取 了 别名 为 p， 为 函数 取 别 名 的 方式 和 为 模块 取 别 名 的 方式 
类 似 ， 也 是 在 语句 后 面 加 上 as，as 后 跟 上 别名 名 称 。 
6.2.2 ”使 用 喜 号 输出 

我 们 在 前 面 的 章节 已 经 看 到 许多 使 用 逗号 输出 的 示例 ， 例 如 : 


>>> student=' 小 智 ' 

>>> print( 学 生 称呼 : ,student) 

学 生 称呼 : 小 智 

这 种 方式 还 可 以 输出 多 个 表达 式 ， 只 要 将 多 个 表达 式 用 逗号 隔 开 就 行 ， 例 如 
>>> greeting=' 大 家 好 ! 

>>> intriduce=' 我 叫 小 智 ，' 

>>> comefrom=' 我 来 自 智 慧 城市 。' 


>>> print(greeting,intriduce,comefrom) 


大 家 好 ! 我 叫 小 智 ， 我 来 自 智 慧 城市 。 
由 输出 结果 看 到 ， 不 使 用 格式 化 的 方式 也 可 以 同时 输出 文本 和 变量 值 。 


6.3 别 样 的 赋值 


之 前 我 们 介绍 了 很 多 赋值 语句 ， 在 实际 使 用 中 ， 赋 值 语句 还 有 很 多 特殊 用 法 ， 掌 握 这些 
用 法 对 于 提高 编程 水 平 很 有 帮助 。 


6.3.1 序列 解 包 


前 面 已 经 有 不 少 赋值 语句 的 示例 ， 比 如 变量 和 数据 结构 成 员 的 赋值 ， 不 过 赋值 的 方法 不 
止 这 些 ， 例 如 : 
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>>> x%,y,z=1,2,3 
>>> print(x,y,z) 
123 


由 输出 结果 看 到 ， 可 以 多 个 赋值 操作 同时 进行 。 后 面 再 遇 到 对 多 个 变量 赋值 时 ， 就 不 需 
要 对 一 个 变量 赋 完 值 再 对 另 一 个 变量 赋值 了 ， 用 一 条 语句 就 可 以 搞定 ， 例 如 : 


>>> %y,=1,2,3 
>>> xy=y,xX 
>>> print(x,y,z) 
pa Ee 


由 输出 结果 看 到 ，x 和 y 的 值 交换 了 ， 所 以 可 以 交换 两 个 或 多 个 变量 的 值 。 
在 Python 中 ， 交 换 所 做 的 事情 叫 作 序列 解 包 (sequence unpacking) 或 可 选 先 代 解 包 ， 即 
将 多 个 值 的 序列 解 开 ， 然 后 放 到 变量 序列 中 。 可 以 通过 下 面 的 示例 理解 : 


>>> nums=1,2,3 

>>> nums 

(lS 

>>> x,y,z=nums 

>>>x # 获 得 序列 解 开 的 值 
1 

>>> print(x,y,z) 

123 


由 输出 结果 看 到 ， 序 列 解 包 后 ， 变 量 获得 了 对 应 的 值 。 
再 看 另 一 个 示例 : 


>>> student={fname':' 小 萌 ',number:'1001 
>>> key,value=student.popitem() 

>>> key 

mumber' 

>>> value 

"1001 





由 输出 结果 可 知 ， 此 处 作用 于 元 组 ， 使 用 popitem 方法 将 键 - 值 作为 元 组 返 
组 可 以 直接 赋值 到 两 个 变量 中 。 

序列 解 包 允 许 函数 返回 一 个 以 上 的 值 并 打包 成 元 组 ， 然 后 通过 一 个 赋值 语句 进行 访问 。 
这 里 有 一 点 要 注意 , 解 包 序列 中 的 元 素数 量 必须 和 放置 在 赋值 符号 “=” 左 边 的 数量 完全 一 致 ， 
否则 Python 会 在 赋值 时 引发 异常 ， 例 如 : 


>>> %,y,z=1,2,3 





互 





， 返 回 的 元 








>>> %,y,z 
(23) 
>>> x,y,z=1,2 


wd 
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Traceback (most recent call last): 
File "<pyshell#45>", line 1, in <module> 
Xx,y,z=12 
ValueError: not enough values to unpack (expected 3, got 2) 
>>> yz=1,2,3,4,5 
Traceback (most recent call last): 
File "<pyshell#46>", line 1, in <module> 
XY,2=12,3,4,5 
ValueError: too many values to unpack (expected 3) 
由 以 上 输出 结果 看 到 ， 当 右边 的 元 素数 量 和 左边 的 变量 数量 不 一 臻 时， 执行 结果 就 会 报 
错 。 错误 原因 是 没有 足够 的 值 解 包 (左边 变量 多 于 右边 元 素 ) 或 多 个 值 未 解 包 (左边 变量 少 于 
右边 元 素 ) 。 
谨 记 在 操作 序列 解 包 时 ， 要 注意 保证 左边 和 右边 数量 的 相等 。 
6.3.2” 链 式 赋值 
6.3.1 小 节 介 绍 了 可 以 对 序列 解 包 ， 序 列 解 包 在 对 不 同 变量 赋 不 同 的 值 时 非常 有 用 ， 赋 相 
同 的 值 时 用 序列 解 包 也 可 以 实现 。 其 实 还 可 以 使 用 其 他 方法 ， 如 链 式 赋值 (Chained 
Assignment) ， 例 如 : 
>>> x=y=z=10 


>>>x 

10 

由 输出 结果 可 知 ， 可 以 通过 多 个 等 式 为 多 个 变量 赋 同 一 个 值 ， 这 种 方法 叫 作 链 式 赋值 。 
链 式 赋值 是 将 同一 个 值 赋 给 多 个 变量 。 

上 面 的 语句 效果 和 下 面 的 语句 效果 一 样 : 

>>>x=10 

>>> y=x 

>>>y 

10 


由 输出 结果 可 知 ， 既 可 以 使 用 链 式 方式 赋值 ， 也 可 以 单独 赋值 ， 显 然 链 式 方法 更 简洁 。 


6.3.3” 增 量 赋值 

我 们 在 第 2 章 讲 解 了 赋值 运算 符 。 使 用 赋值 运算 符 时 没有 将 表达 式 写成 类 似 x=x+1 的 形 
式 , 而 是 将 表达 式 放置 在 赋值 运算 符 (=) 的 左边 (如 将 x=x+1 写成 x+=1), 这 种 写法 在 Python 
中 叫 作 增 量 赋值 (Augemented Assignment) 。 这 种 写法 对 * ( 乘 ) 、/〔 除 ) 、%〔 取 模 ) 等 标 
准 运算 符 都 适用 ， 例 如 : 

>>> x=5 

>>>x+=1 # 加 
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二 > 学 
6 

>>> x-=2 # 减 
>>> X 

4 

>>> x*=2 # 琵 
>>>X 

8 

>>>wW=4 # 除 
>>>X 

2.0 


由 操作 结果 可 以 看 到 ， 使 用 增 量 赋值 相对 赋值 操作 看 上 去 更 简洁 。 

增 量 赋值 除了 适用 于 数值 类 型 ， 还 适用 于 二 元 运算 符 的 数据 类 型 ， 例 如 : 
>>> field ='Hello, 

>>> field += "world' 

>>> field 

'Hello,world' 

>>> field*=2 

>>> field 

'Hello,worldHello,world' 


由 操作 结果 可 知 ， 增 量 赋值 操作 也 可 以 用 于 字符 串 。 
增 量 赋值 可 以 让 代码 在 很 多 情况 下 更 易 读 ， 也 可 以 帮助 我 们 写 出 更 紧凑 、 简 练 的 代码 。 


6.4 语 句 块 


语句 块 并 非 一 种 语句 ， 语 句 块 是 一 组 满足 一 定 条 件 时 执行 一 次 或 多 次 的 语句 。 语 句 块 的 
创建 方式 是 在 代码 前 放置 空格 缩 进 。 

同一 段 语句 块 中 每 行 语句 都 要 保持 同样 的 缩 进 ， 如 果 缩 进 不 同 ，Python 编译 器 就 会 认为 
不 属于 同一 个 语句 块 或 认为 是 错误 的 。 

在 Python 中 ， 冒 号 (:) 用 来 标识 语句 块 的 开始 ， 语 句 块 中 每 一 个 语句 都 需要 缩 进 〈 缩 进 
量 相同 ) 。 当 退回 到 和 已 经 闭合 的 块 一 样 的 缩 进 量 时 ， 表 示 当 前 语句 块 已 经 结束 了 。 


6.5 条 件 语句 


到 目前 为 止 ， 我 们 编写 的 程序 都 是 简单 地 按 语句 顺序 一 条 一 条 执行 的 。 本 节 将 介绍 让 程 
序 选 择 执行 语句 的 方法 。 


lig 
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6.5.1 布尔 变量 的 作用 


布尔 变量 我 们 在 第 2 章 已 经 有 所 接触 ， 第 2 章 的 运算 符 中 多 处 提 到 的 True、False 就 是 布 
尔 变 量 , 布尔 变量 一 般 对 应 的 是 布尔 值 (也 称 作 真 值 , 布尔 值 这 个 名 字 是 根据 对 真 值 做 过 大 量 
研究 的 George Boole 命名 的 ) 。 

下 面 的 值 在 作为 布尔 表达 式 时 ， 会 被 解释 器 看 作假 false》: 

False None0 "ODO 


换 句 话说 ， 标 准 值 False 和 None、 所 有 类 型 的 数字 0 〈 包 括 浮 点 型 、 长 整 型 和 其 他 类 型 ) 、 空 
序列 〈 如 空 字符 串 、 空 元 组 和 空 列 表 ) 以 及 空 字典 都 为 假 。 其 他 值 都 为 真 ， 包 括 原生 的 布尔 值 True。 

Python 中 所 有 值 都 能 被 解释 为 真 值 ， 这 可 能 会 让 你 不 太 明白 ， 但 理解 这 点 非常 有 用 。 在 
Python 中 ， 标 准 的 真 值 有 True 和 False 两 个 。 在 其 他 语言 中 ， 标 准 的 真 值 为 0 (表示 假 ) 和 1 
(表示 真 ) 。 事 实 上 ，True 和 False 只 不 过 是 1 和 0 的 另 一 种 表现 形式 ， 作 用 相同 ， 例 如 : 


>>> True 





True 
>>> False 
False 


>>> Tme 一 1 


True 

>>> False 一 0 
True 

>>> True+False+2 


3 


由 上 面 的 输出 结果 看 到 ， 在 Python 中 ，True 和 1 等 价 ，False 和 0 等 价 。 
布尔 值 True 和 False 属于 布尔 类 型 ，bool 函数 可 以 用 来 转换 其 他 值 ， 例 如 : 
>>> bool(good good study) 

True 

>>> bool(") 

False 

>>> bool(3) 

True 

>>> bool(0) 

False 

>>> bool([1]) 

True 

>>> bool([]) 

False 

>>> bool() 


False 
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由 输出 结果 看 到 ， 可 以 用 bool 函数 做 boolean 值 转换 。 
因为 所 有 值 都 可 以 用 作 布 尔 值 ( 真 值 )， 所 以 几乎 不 需要 对 它们 进行 显 式 转换 ，Python 
会 自动 转换 这 些 值 。 


尽管 0 和 "" 都 为 假 ， 即 bool([])==bool("") 一 False， 不 过 它们 本 身 不 相等 ， 即 中 !=""。 其 他 
注 意 不 同类 型 的 假 值 也 是 如 此 ， 如 ()!=False。 


6.5.2 if 语句 


真 值 可 以 联合 使 用 ， 首 先 看 如 下 代码 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 
##f 基本 用 法 


greeting='hello’ 
if greeting 一 'hello': 
print('hello') 

该 示例 执行 结果 如 下 : 

hello 

该 示例 为 让 条 件 执行 语句 的 一 个 实现 示例 。 如 果 条 件 〈 在 让 和 冒号 之 间 的 表达 式 ) 判定 
为 真 ， 后 面 的 语句 块 〈 本 例 中 是 print 语句 ) 就 会 被 执行 ， 如 果 条 件 判定 为 假 ， 语 句 块 就 不 会 
被 执行 。 

上 述 示例 代码 的 执行 过 程 如 图 6-5 所 示 。 


如 果 条 件 为 false 


6-5 让 条 件 语句 执行 过 程 
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图 6-5 中 的 小 黑 点 为 让 语句 的 起 点 , 往 后 执行 到 条 件 语句 (条 件 语句 如 greeting 一 'hello')， 
如 果 条 件 为 真 ， 就 执行 条 件 代码 ， 然 后 结束 这 个 if 条 件 语 句 ， 如 果 条 件 为 假 ， 就 跳 过 这 段 条 
件 代 码 ， 这 个 站 条 件 语句 直接 结束 。 

在 让 语句 块 中 还 可 以 执行 一 些 复杂 操作 ， 例 如 : 

#! /usr/bin/python3 

#-*- coding:UTF-8 -*- 


#if 基本 用 法 
greeting='hello' 
if greeting 一 "hello' 
student={" 小 萌 ':'1001", "小 智 : "1002', "小 强 ': 1005', 小 张 : "1006'} 
print(' 字 典 元 素 个 数 为 : %d 个 ' % len(student)) 
student.clear() 
print(' 字 典 删 除 后 元 素 个 数 为 : %d 个 ' % len(student)) 


以 上 程序 执行 结果 为 : 
字典 元 素 个 数 为 : 4 个 
字典 删除 后 元 素 个 数 为 : 0 个 
此 处 的 让 语句 块 由 多 条 语句 组 成 ， 编 写 过 程 中 要 注意 保持 语句 的 缩 进 一 致 ， 否 则 在 执行 
时 会 报错 。 
论语 句 的 条 件 判 定 除了 使 用 一 外 ， 还 可 以 使 用 > (大 于 ) 、<( 小 于 )、>= (大 于 等 于 ) 、<= 
(小 于 等 于 ) 等 条 件 符 表 示 大 小 关系 。 除 此 之 外 , 还 可 以 使 用 各 个 函数 或 方法 返回 值 作为 条 件 
判定 。 使 用 条 件 符 的 操作 和 使 用 一 一 样 ， 使 用 函数 或 表达 式 的 操作 在 后 续 章 节 会 逐步 介绍 。 
在 练习 过 程 中 ， 要 习惯 编写 示例 中 开头 两 行 的 写法 ， 即 习惯 写 以 下 两 行 代 码 : 
#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 














习惯 写 这 两 行 代码 可 以 帮助 你 在 代码 移植 和 编码 问题 上 避免 很 多 问题 。 代 码 移植 时 ， 如 
果 从 Windows 移植 到 Linux 系统 上 ， 就 必须 加 上 第 一 行 代码 。 代 码 中 有 中 文 时 ， 如 果 不 
加 第 二 行 ， 就 很 容易 出 现 乱码 的 情况 。 


6.5.3 else 子 句 


在 让 语句 的 示例 中 ， 当 greeting 的 值 为 hello 时 ， 让 后 面 的 条 件 执行 结果 为 ttue， 进 入 下 
面 的 语句 块 中 执行 相关 语句 。 如 果 greeting 的 值 不 是 hello， 就 不 能 进入 语句 块 ， 如 果 想 显示 
相关 提示 ， 比 如 告诉 我 们 greeting 的 值 不 为 hello 或 执行 的 不 是 让 中 的 语句 块 ， 该 怎么 办 呢 ? 
例如 : 

#! /usr/bin/python3 

# -#- coding:UTF-8 -*- 
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greeting= hi 
if greeting 一 'hello': 
print(hello) 
else: 
print(' 该 语句 块 不 在 论 中 ，greeting 的 值 不 是 hello') 


这 段 程序 加 入 了 一 个 新 条 件 子 句 一 一 else 子 句 。 之 所 以 叫 子 句 ,是 因为 else 不 是 独立 语句 ， 
只 能 作为 让 语句 的 一 部 分 。 使 用 else 子 句 可 以 增加 一 种 选择 。 

该 程序 的 输出 结果 如 下 : 

该 语句 块 不 在 if 中 ，greeting 的 值 不 是 hello 


由 输出 结果 看 到 ，if 语句 块 没有 被 执行 ， 执 行 的 是 else 子 句 中 的 语句 块 。 同 让 语句 一 样 ， 
else 子 句 中 的 语句 块 也 可 以 编写 复杂 语句 。 


【分 在 else 子 名 后面 没有 条 件 判 定 。 
注 意 


6.5.4 ”elif 子 句 


在 else 子 句 的 示例 中 ， 如 果 除 让 条 件 外 ， 还 有 多 个 子 条 件 需 要 判定 ， 该 怎么 办 呢 ? 

Python 为 我 们 提供 了 一 个 elif 语句 ，elif 是 else 让 的 简写 ， 意 思 为 具有 条 件 的 else 子 句 ， 
例如 : 

#! /usr/bin/python3 

#-*- coding:UTF-8 -*- 


num = 10 
ifnum > 10: 
print(num 的 值 大 于 10) 
elif 0<=num<=10: 
print(num 的 值 介 于 0 到 10 之 间 ') 
else: 


print(num 的 值 小 于 0) 
由 以 上 程序 可 知 ，elif 需要 和 认 else 子 句 联合 使 用 ， 不 能 独立 使 用 ， 并 且 必 须 以 证 语句 
开头 ， 可 以 选择 是 否 以 else 子 句 结尾 。 
程序 输出 结果 如 下 : 
num 的 值 介 于 0 到 10 之 间 
由 输出 结果 得 知 ， 这 段 程序 执行 的 是 elif 子 句 中 的 语句 块 ， 即 elif 子 句 的 条 件 判定 结果 为 
true， 所 以 执行 这 个 子 句 后 的 语句 块 。 
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6.5.5” 幅 套 代码 块 
我 们 前 面 讲述 了 论语 句 、else 子 句 、elif 子 句 ， 这 几 个 语句 可 以 进行 条 件 的 选择 判定 ， 不 
过 我 们 在 实际 项 目 开发 中 经 常 需要 一 些 更 复杂 的 操作 ， 例 如 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


num = 10 
让 num%2 一 0: 
if num%3=—0: 
print ("你 输入 的 数字 可 以 整除 2 和 3") 
elifnum%4 一 0: 
print ("你 输入 的 数字 可 以 整除 2 和 4") 
else: 
print ("你 输入 的 数字 可 以 整除 2， 但 不 能 整除 3 和 4") 
else: 
ifnum%3 一 0: 
print ("你 输入 的 数字 可 以 整除 3， 但 不 能 整除 2") 
else: 
print ("你 输入 的 数字 不 能 整除 2 和 3") 
由 上 面 的 程序 可 知 ， 在 让 语句 的 语句 块 中 还 存在 if 语句 、 语 句 块 以 及 else 子 句 ，else 子 
句 的 语句 块 中 也 存在 让 语 句 和 else 子 句 。 
上 面 的 程序 输出 结果 如 下 : 
你 输入 的 数字 可 以 整除 2， 但 不 能 整除 3 和 4 


由 输出 结果 可 以 看 出 ， 执 行 的 是 让 语句 块 中 else 子 句 的 语句 块 。 

在 Python 中 ， 该 示例 使 用 的 这 种 结构 的 代码 称 作 嵌 套 代码 。 所 谓 柑 套 代 码 ， 是 指 把 站、 
else、elif 等 条 件 语句 再 放 入 if、else、elif 条 件 语句 块 中 ， 作 为 深层 次 的 条 件 判定 语句 。 
6.5.6 更 多 操作 

我 们 在 第 2 章 简单 介绍 过 一 些 运算 符 ， 本 节 将 对 其 中 一 些 涉 及 条 件 运 算 的 运算 符 做 进 一 
步 讲 解 。 

1.is: 同一 性 运算 符 

is 运算 符 比较 有 趣 。 我 们 先 看 如 下 程序 : 


>>> x=y=[12,3] 
>>> 二 [12,3] 
>>x—=y 


True 
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>>> x—z 
True 
>>>xisy 
True 
>>>xisz 


False 


在 最 后 一 个 输出 语句 之 前 ， 一 切 看 起 来 非常 美好 ， 都 在 意料 中 ， 不 过 最 后 一 个 语句 却 出 
现 了 问题 ， 为 什么 x 和 z 相等 却 不 相同 呢 ? 

这 是 因为 is 运算 符 用 于 判定 同一 性 而 不 是 相等 性 。 变 量 x 和 y 被 绑 定 在 同一 个 列表 上 ， 而 
变量 z 被 绑 定 在 另 一 个 具有 相同 数值 和 顺序 的 列表 上 。 它 们 的 值 可 能 相等 ， 却 不 是 同一 个 对 象 。 

也 可 以 从 内 存 的 角度 思考 , 即 它们 所 指向 的 内 存 空间 不 一 样 , x 和 y 指向 同一 块 内 存 空间 ， 
z 指 向 男 一 块 内 存 空间 。 

是 不 是 看 起 来 有 些 不 可 理喻 ， 再 看 如 下 示例 : 

>>> x=[1,2,3] 

>> y=[1,5] 

>>>xisnoty 

True 

>>> del x[2] 

>>>x 

[1, 引 

>>> y[1]=2 

>>>y 

号, 习 

>>x—y 

True 

>>>xisy 


False 


在 上 面 的 程序 中 ， 列 表 x 和 y 一 开始 是 不 同 的 列表 ， 后 面 将 列表 值 更 改 为 相等 ， 但 还 是 
两 个 不 同 的 列表 ， 即 两 个 列表 值 相等 却 不 等 同 。 

综 上 所 述 ， 使 用 二 运算 符 判 定 两 个 对 象 是 否 相 等 ， 使 用 is 判定 两 个 对 象 是 否 等 同 〈 是 否 
为 同一 对 象 ) 。 


尽量 避免 用 is 运算 符 比 较 数 值 和 字符 串 这 类 不 可 变 值 。 由 于 Python 内 部 操作 这 些 对 象 方 


并 ” 式 的 原因 ， 使 用 is 运算 符 的 结果 是 不 可 预测 的 ， 除 非 你 对 堆栈 有 一 定 熟悉 程度 ， 否 则 很 
提 示 。 难 预 测 运算 结果 。 
2. 比较 字符 串 和 序列 


字符 串 可 以 按照 字母 排列 顺序 进行 比较 ， 我 们 在 前 面 的 章节 已 经 介绍 过 。 这 里 介绍 其 他 
序列 的 比较 操作 。 
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其 他 序列 比较 的 不 是 字符 而 是 元 素 的 其 他 类 型 ， 例 如 : 


>>> [1,2]<[2,1] 
True 

>>> [1,2]<[1,2] 
False 

>>> [L2] 一 [L2] 


True 
由 操作 结果 可 知 ， 也 可 以 对 列表 进行 比较 操作 。 
如 果 一 个 序列 中 包括 其 他 序列 元 素 ， 比 较 规则 也 适用 于 序列 元 素 ， 例 如 : 


>>> [2,[1,2]]<[2,[1,3]] 
True 


由 操作 结果 看 到 ， 也 可 以 对 嵌 套 列表 进行 比较 操作 。 

3. 布尔 运算 符 

前 面 我 们 已 经 讲述 过 不 少 布尔 运算 的 操作 。 不 过 有 时 要 检查 一 个 以 上 的 条 件 ， 如 果 按 照 
前 面 的 操作 方式 ， 就 会 多 走 一 些 弯路 ， 例 如 : 

#! /usr/bin/python3 

# -*- coding:UTF-8 -*- 


num = 10 
让 num <= 10: 
if num>=5; 
print(num 的 值 介 于 5 到 10 之 间 ') 
else: 
printCnum 的 值 不 介 于 5 到 10 之 间 ') 
else: 
print(num 的 值 不 介 于 5 到 10 之 间 ') 
上 面 的 程序 在 写法 上 没什么 问题 ， 但 是 走 了 一 些 不 必要 的 弯路 ， 可 以 将 代码 编写 得 更 简洁 : 
if num <= 10 and num>=5: 
print(num 的 值 介 于 5 到 10 之 间 ') 
else: 
Print(num 的 值 不 介 于 5 到 10 之 间 ') 
或 者 : 
if 5 <= num <= 10: 
print(Cnum 的 值 介 于 5 到 10 之 间 ) 


else: 


print(num 的 值 不 介 于 5 到 10 之 间 ) 
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上 面 的 程序 明显 更 加 简洁 、 易 读 。 

and 运算 符 用 于 连接 两 个 布尔 值 ， 并 在 两 者 都 为 真 时 返回 真 ， 否 则 返回 假 。 与 and 同类 的 
还 有 or 和 not 两 个 运算 符 。 

布尔 运算 符 有 一 个 有 趣 的 特性 : 只 有 在 需要 求 值 时 才 求 值 。 举 例 来 说 ， 表 达 式 xand y 需 
要 两 个 变量 都 为 真 时 才 为 真 ， 所 以 如 果 x 为 假 ， 表 达 式 就 立刻 返回 false， 无论 y 的 值 是 多 少 。 
实际 上 ， 如 果 x 为 假 ， 表 达 式 就 会 返回 x 的 值 ， 否 则 返回 y 的 值 。 这 种 行为 被 称 为 短路 逻辑 

(short-circuit logic ) 或 惰性 求 值 (lazy evaluation〉。 布 尔 运 算 符 通常 被 称 为 逻辑 运算 符 ， 这 

种 行为 同样 适用 于 or。 在 表达 式 x or y 中 ，x 为 真 时 直接 返回 x 的 值 ， 否 则 返回 y 值 。 注 意 ， 
这 意味 着 在 布尔 运算 符 后 面 的 代码 都 不 会 被 执行 。 


6.5.7 ”断言 
在 Python 中 , 有 一 个 和 让 语句 工作 方式 非常 相近 的 关键 字 , 其 工作 方式 类 似 如 下 伪 代 码 : 


if not condition: 





crash program 


在 Python 中 为 什么 需要 这 样 的 代码 呢 ? 
在 没完 善 一 个 程序 之 前 ， 我 们 不 知道 程序 会 在 哪里 出 错 ， 与 其 在 运行 时 骨 溃 ， 不 如 在 出 
现 错误 条 件 时 就 崩溃 。 一 般 来 说 ， 可 以 要 求 一 些 条 件 必 须 为 真 。 在 Python 中 ，assert 关键 字 能 
实现 这 种 工作 方式 。 先 来 看 一 个 示例 : 
>>> x=3 
>>> assert x > 0, "Xx is not Zero or negative”" 
>>> assert x%2 一 0, "x is not an even number" # 提 示 x 不 是 偶数 
Traceback (most recent call last): 
File "<pyshell#81>", line 1, in <module> 
assert X%2 一 0, "x is not an even number" 
AssertionError: x is not an even number 


由 上 面 的 输出 结果 看 到 ， 当 assert 后 面 的 条 件 为 真 时 ， 程 序 正常 运行 ， 当 assert 后 面 的 条 
件 为 假 时 , 输出 错误 信息 。 错误 的 提示 信息 由 我 们 自己 定义 , 这 个 错误 提示 信息 可 以 称 为 异常 
参数 。assert 的 异常 参数 是 在 断言 表达 式 后 添加 的 字符 串 信息 ， 用 来 解释 断言 并 更 容易 知道 问 
题 出 在 哪里 。 

使 用 assert 断言 是 学 习 Python 的 好 习惯 ，Python assert 断言 句 语 格式 及 用 法 很 简单 。 

使 用 assert 断言 时 ， 要 注意 以 下 几 点 : 


(1) assert 断言 用 来 声明 某 个 条 件 是 真 的 。 

(2) 如 果 你 非常 确信 你 使 用 的 列表 中 至 少 有 一 个 元 素 ， 想 要 检验 这 一 点 ， 并 在 它 非 真 时 
引发 一 个 错误 ， 那 么 assert 语句 是 应 用 在 这 种 情形 下 的 理想 语句 。 

(3) assert 语句 失败 时 ， 会 引发 一 个 AssertionError。 
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6.6 循 环 


程序 在 一 般 情 况 下 是 按 顺 序 执行 的 。 编 程 语言 提供 了 各 种 控制 结构 ， 人 允许 更 复杂 的 执行 
路 径 。 循 环 语句 允许 我 们 多 次 执行 一 个 语句 或 语句 组 。 图 6-6 所 示 为 大 多 数 编程 语言 中 循环 语 
句 的 执行 流程 。 


生生 和 生生 


条 件 代码 


1 
条 件 为 tme 


M 


条 件 为 false 


鳞 


图 6-6 循环 语句 执行 流程 
我 们 已 经 知道 条 件 为 真 ( 或 假 ) 时 程序 如 何 执行 了 。 若 想 让 程序 重复 执行 ， 该 怎么 办 呢 ? 
比如 输出 1 一 100 所 有 数字 ， 是 写 100 个 输出 语句 吗 ? 显然 你 不 想 这 样 做 。 接 下 来 我 们 学 习 如 
何 解 决 这 个 问题 。 
6.6.1 while 循环 
我 们 先 看 如 何 使 用 简单 的 程序 输出 1 一 100 所 有 数字 ， 程 序 如 下 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 

















n=1 
while n<=100: 
print(' 当 前 数字 是 : 'm) 
| 
由 输入 程序 看 到 ， 只 需 短 短 几 行 就 可 以 实现 这 个 功能 ， 我 们 看 输出 结果 《〈 由 于 全 部 输出 
会 太 长 ， 也 没有 必要 ， 此 处 显示 几 行 输出 结果 作为 展示 ) : 


. 128 . 
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当前 数字 是 : 
当前 数字 是 : 
当前 数字 是 : 
当前 数字 是 : 
当前 数字 是 : 


由 输出 结果 看 到 ， 按 顺序 输出 了 对 应 结果 。 

该 示例 中 使 用 了 while 关键 字 。 在 Python 编程 中 , while 
语句 用 于 循环 执行 程序 ， 以 处 理 需 要 重复 处 理 的 任务 。 基 
本 语法 形式 为 : 

while 判断 条 件 : 

执行 语句 …… 


执行 语句 可 以 是 单个 语句 或 语句 块 。 判断 条 件 可 以 是 
任何 表达 式 ， 所 有 非 零 、 非 空 (null) 的 值 都 为 真 (true) 。 
当 判 断 条 件 为 假 〈false) 时 ， 循 环 结束 。 

while 循环 的 执行 流程 如 图 6-7 所 示 。 

该 流程 图 的 意思 为 : 首先 对 while 条 件 判定 ， 当 条 件 
为 true 时 ， 执 行 条 件 语 句 块 ， 执 行 完 语句 块 再 判定 while 
条 件 , 若 仍然 为 true, 则 继续 执行 语句 块 , 直到 条 件 为 false 
时 结束 循环 。 


6.6.2 for 循环 


mmP 一 










while expression : 
statement(s) 


condition 


if condition 
is true 






conditional 
code 






If condition 
is false 


图 6-7 while 循环 执行 流程 


我 们 6.6.1 小 节 讲 述 了 while 循环 ， 可 以 看 到 while 语句 非常 灵活 。 例 如 以 下 代码 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


n=0 

fields=['a','b','c'] 

while n<len(fields): 
print(' 当 前 字母 是 : ,fields[n]) 


| 


该 代码 实现 的 功能 是 将 列表 中 的 元 素 分 别 和 输出。 该 程序 的 实现 没有 什么 问题 ， 我 们 是 否 


有 更 好 的 方式 实现 这 个 功能 呢 ? 答案 是 有 ， 例 如 : 


#! /usr/bin/python3 
# -#- coding:UTF-8 -*- 
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fields=[a,b:c] 
forfin fields: 
print(' 当 前 字母 是 : ',f) 
可 以 看 到 , 代码 比 前 面 使 用 while 循环 时 更 简洁 , 代码 量 也 更 少 。 程序 执行 输出 结果 如 下 : 
当前 字母 是 a 
当前 字母 是 : b 
当前 字母 是 : ¢ 
该 示例 使 用 了 for 关键 字 。 在 Python 中 ，for 关键 字 叫 做 for 循环 ，for 循环 可 以 遍历 任何 
序列 的 项 目 ， 如 一 个 列表 或 字符 串 。 
for 循环 的 语法 格式 如 下 : 
for iterating_var in sequence: 
statements(s) 


sequence 是 任意 序列 , iterating_var 是 序列 中 需要 遍历 的 元 素 。statements 是 待 执行 的 语句 块 。 
for 循环 的 执行 流程 如 图 6-8 所 示 。 






for iterating_var in sequence : 
statement(s) 


If no more item in sequence 


sequence 







Next item from sequence 


execute statement(s) 





图 6-8 for 循环 执行 流程 


该 流程 图 的 意思 为 : 首先 对 for 条 件 判定 ， 游 标 ( 后 面 会 详细 讲解 这 个 词 ) 指向 第 0 个 位 
置 , 即 指向 第 一 个 元 素 , 看 sequence 序列 中 是 否 有 元 素 ， 若 有 ， 则 将 元 素 值 赋 给 iterating_var， 
接着 执行 语句 块 ， 若 语句 块 中 需要 获取 元 素 值 ， 则 使 用 iterating_var 的 值 ， 执 行 完 语句 块 后 ， 
将 序列 的 游标 往 后 挪 一 个 位 置 , 再 判定 该 位 置 是 否 有 元 素 , 若 仍然 有 元 素 , 则 继续 执行 语句 块 ， 
然后 序列 的 游标 再 往 后 挪 一 个 位 置 ， 直 到 下 一 个 位 置 没 有 元 素 时 结束 循环 。 

我 们 再 看 以 下 示例 : 

#! /usr/bin/python3 

#-*- coding:UTF-8 -*- 
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Print(-----for 循环 字符 串 一 ------ 一 -') 
for letter in 'good': 。”#for 循环 字符 串 
print (' 当 前 字母 :, letter) 


print('-----for 循环 数字 序列 -- 一 一--) 

number=[1,2,3] 

fornum in number: #for 循环 数字 序列 
print(' 当 前 数字 : ,num) 


print(----for 循 环 字典 -一 -一 -- 出 

tups={fmame': 小 智 ,number:"10024 

fortup in tups:  #for 循环 字典 
print('%s:%s' % (tup,tups[tup])) 


输出 结果 如 下 : 


-for 循 环 字符 串 一 -- 一 -一 
当前 字母 :g 

当前 字母 :o 

当前 字母 :o 

当前 字母 : d 

-----for 循环 数字 序列 ---------- 
当前 数字 : 1 

当前 数字 : 2 

当前 数字 : 3 

一 -一 for 循环 字典 ------- 一 -- 
number:1002 


name: 小 智 


由 上 面 的 输入 代码 和 输出 结果 可 以 看 到 ，for 循环 的 使 用 还 是 比较 方便 的 。 


【分 如 果 能 使 用 for 循环 ， 就 尽量 不 要 使 用 while 循环 。 


提 


示 


6.6.3 ”循环 遍历 字典 元 素 
在 6.6.2 小 节 的 示例 中 我 们 已 经 提供 了 使 用 for 循环 遍历 字典 的 代码 ， 代 码 如 下 : 


tups={"name*:' 小 智 ','number':'1002'} 
for tup in tups: ”#for 循环 字典 
print( ybs:%S % (tup,tups[tup])) 


可 以 看 到 ， 此 处 用 for 循环 对 字典 的 处 理 看 起 来 有 一 些 繁杂 ， 是否 可 以 使 用 更 直观 的 方式 


音字 典 呢 ? 
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还 记得 我 们 前 面 学 习 的 序列 解 包 吗 ? for 循环 的 一 大 好 处 是 可 以 在 循环 中 使 用 序列 解 包 ， 
例如 : 
tups=fmame':' 小 智 ,number:"1002? 
for key,value in tups.items(): 
Pprint('%s:%s' % (key,value)) 


输出 结果 如 下 : 


number:1002 


name: 小 智 
由 输入 代码 和 输出 结果 看 到 ， 可 以 使 用 items 方法 将 键 - 值 对 作为 元 组 返回 。 


字典 中 的 元 素 是 没有 顺序 的 。 也 就 是 说 ， 和 迭代 时 字典 中 的 键 和 值 都 能 保证 被 处 理 ， 但 是 
注意 ”处理 顺序 不 确定 。 这 也 是 用 for 循环 输出 字典 中 的 元 素 时 不 按照 顺序 输出 的 原因 。 


6.6.4 ”和 迭代 工具 


在 Python 中 ， 和 帮 代 序列 或 其 他 可 选 代 对 象 时 ， 有 一 些 函 数 非常 有 用 。 下 面 我 们 介绍 一 些 
有 用 的 函数 。 

1. 并 行 迭代 

旺 序 可 以 同时 迭代 两 个 序列 ， 输 入 如 下 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


student=['xiaomeng','xiaozhi','xiaoqiang'] 

number=[1001,1002,1003] 

for i in range(len(student)): 
print(student[j], 的 学 号 是 : ,number[i) 


程序 执行 结果 如 下 : 
xiaomeng 的 学 号 是 : 1001 


xiaozhi 的 学 号 是 : 1002 
xiaoqiang 的 学 号 是 : 1003 


在 程序 中 ，i 是 循环 索引 的 标准 变量 名 。 
在 Python 中 ， 内 建 的 zip 函数 用 来 进行 并 行 欠 代 ， 可 以 把 两 个 序列 合并 在 一 起 ， 返 回 一 
个 元 组 的 列表 ， 例 如 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


sl 
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student=['xiaomeng','xiaozhi','xiaogiang'] 
number=[1001,1002,1003] 
for name,num in zip(student,number): 
print(name,' 的 学 号 是 : ,num) 
程序 执行 结果 和 前 面 一 样 。 
zip 函数 可 以 作用 于 任意 数量 的 序列 ， 并 且 可 以 应 付 不 等 长 的 序列 ， 当 短 序列 “用 完 ” 时 


就 会 停止 。 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


for numl ,num?2 in zip(range(3),range(100)): 
print('zip 键 值 对 为 : ,numl:num2) 
程序 执行 结果 如 下 : 


zip 键 值 对 为 : 00 
zip 键 值 对 为 : 11 
zip 键 值 对 为 : 22 


由 输出 结果 看 到 ，zip 函数 以 短 序列 为 准 ， 当 短 序列 遍历 结束 时 ，for 循环 就 会 遍历 结束 。 


此 处 用 到 range 函数 ， 是 Python 3 中 的 函数 ， 在 Python 2 版 本 中 存在 与 这 个 函数 功能 类 


提示 似 的 xrange 函数 。 


2. 翻转 和 排序 迭代 
我 们 在 列表 中 学 习 过 reverse 和 sort 方法 ,此 处 介绍 两 个 类 似 的 函数 一 一 reversed 和 sorted 





函数 。 这 两 个 函数 可 作用 于 任何 序列 或 可 和 迭代 对 象 ,但 不 是 原 地 修改 对 象 ， 而 是 返回 翻转 或 排 
序 后 的 版 本 。 在 交互 模式 下 输入 : 


滨 





滨 











>>> sorted([5,3,7,1]) 

L357] 

>>> sorted('hello,world!') 
| 
>>> list(reversed('hello,world!')) 
由 | 
>>> "join(reversed(hello,world!)) 
"ldlrow,olleh' 


由 输出 结果 我 们 看 到 ，sorted 函数 返回 的 是 一 个 列表 ，reversed 函数 返回 的 是 一 个 可 迭代 


| 象 。 它 们 的 具体 含义 不 用 过 多 关注 ， 在 for 循环 和 join 方法 中 使 用 不 会 有 任何 问题 。 如 果 要 
| 这 两 个 函数 使 用 索引 、 分 片 及 调用 list 方法 ， 就 可 以 使 用 list 类 型 转换 返回 对 象 。 
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6.6.5 ”跳出 循环 


我 们 在 前 面 的 示例 中 讲 过 ， 循 环 会 一 直 执行 ， 直 到 条 件 为 假 或 序列 元 素 用 完 时 才 会 结束 。 
若 我 们 想 提 前 中 断 循 环 ， 比 如 循环 的 结果 已 经 是 我 们 想 要 的 了 , 不 想 让 循环 继续 执行 而 占用 资 
源 ， 有 什么 方法 可 以 实现 呢 ? 

Python 提供 了 break、continue 等 语句 可 用 于 这 种 情形 。 

1. break 

break 语句 用 来 终止 循环 语句 ， 即 使 循环 条 件 中 没有 False 条 件 或 序列 还 没有 遍历 完 ， 也 
会 停止 执行 循环 语句 。 

break 语句 用 在 while 和 for 循环 中 。 

如 果 使 用 典 套 循环 ，break 语句 就 会 停止 执行 最 深层 的 循环 ， 并 开始 执行 下 一 行 代码 。 

break 语句 语法 如 下 : 

break 

break 语句 的 执行 流程 如 图 6-9 所 示 。 






conditional 
code 







f condition 
is true 







condition 









f condition 
is false 





图 6-9 break 执行 流程 
当 遇 到 break 语句 时 ， 无 论 执行 什么 条 件 ， 都 跳出 这 个 循环 ， 例 如 : 
#! /usr/bin/python3 


#*- coding:UTF-8 -*- 


for letter in 'hello': # 示 例 1 
if letter 一 由: 
break 
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print (' 当 前 字母 为 :, letter) 
num= 10 # 示 例 2 
while num > 0: 

print (输出 数字 为 :, num) 

num 一 1 

if num 一 8: 

break 

输出 结果 如 下 : 
当前 字母 为 :h 
当前 字母 为 :e 


输出 数字 为 : 10 
输出 数字 为 : 9 


由 输出 结果 看 到 ， 在 示例 1 中 ， 输 出 语句 输出 循环 遍历 到 的 字符 ， 当 遇 到 指定 字符 时 ， 


跳出 for 循环 。 在 示例 2 中 ， 使 用 while 做 条 件 判定 ， 
在 语句 块 中 输出 满足 条 件 的 数字 ， 当 数字 等 于 8 时 ， 
跳出 while 循环 ， 不 再 继续 遍历 。 


2. continue 


continue 语句 用 来 告诉 Python 跳 过 当前 循环 的 剩 
余 语句 ， 然 后 继续 进行 下 一 轮 循环 。 

continue 语句 用 在 while 和 for 循环 中 。 

continue 语句 的 语法 格式 如 下 : 

continue 


continue 语句 的 执行 流程 如 图 6-10 所 示 。 
当 执行 过 程 中 遇 到 continue 语句 时 ， 无 论 执行 条 
件 是 真 还 是 假 ， 都 跳 过 这 次 循环 ， 进 入 下 一 次 循环 ， 
例如 : 
#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 
for letter in 'hello': # 示例 1 
if letter =— 由: 
continue 
print (' 当 前 字母 :', letter) 
num=3 # 示例 2 


while num > 0: 








conditional 
code 


fcondition 
is true 


continue 


condition 


If condition 
is false 


图 6-10 continue 执行 流程 
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num=1 
ifnum 一 2: 
continue 

print (' 当 前 变量 值 :', num) 
输出 结果 如 下 : 
当前 字母 :h 
当前 字母 :e 
当前 字母 :o 
当前 变量 值 : 1 
当前 变量 值 :0 


由 输出 结果 看 到 ， 相 比 于 break 语句 ， 使 用 continue 语句 只 是 跳 过 一 次 循环 ， 不 会 跳出 整 
个 循环 。 


6.6.6 ”循环 中 的 else 子 名 

在 开发 过 程 中 ， 可 能 需要 在 while、for 等 循环 不 满足 条 件 时 做 一 些 工 作 。 该 怎么 实现 呢 ? 
下 面 进行 介绍 。 

1. 在 while 循环 中 使 用 else 语句 

在 while 条 件 语句 为 false 时 ， 执 行 else 的 语句 块 ， 例 如 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


num=0 
while num < 3: 
print (num, ”小 于 3") 
num=num+1 
else: 
print (num, ”大 于 或 等 于 3") 
print(" 结 束 循环 !") 
执行 结果 如 下 : 
3 
小 于 3 
小 于 3 
大 于 或 等 于 3 
结束 循环 ! 


由 输出 结果 看 到 ，while 循环 结束 后 执行 了 else 语句 中 的 语句 块 ， 输 出 “3 大 于 或 等 于 3” 
语句 。 


wb 一 号 
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2. 在 for 循环 中 使 用 else 语句 
在 for 条件 语句 为 false 或 结束 后 没有 被 break 中 断 时 ， 执 行 else 的 语句 块 ， 例 如 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


names = ['xiaomeng', ‘xiaozhi] 
for name in names: 
if name == "xiao": 
print(" 名 称 : "name) 
break 
print(" 循 环 名 称 列表 "+ name) 
else: 
print(" 没 有 循环 数据 !") 
print(" 结 束 循环 !") 

旦 序 执行 结果 如 下 : 
循环 名 称 列表 xiaomeng 
循环 名 称 列表 xiaozhi 
没有 循环 数据 ! 
结束 循环 ! 


由 输出 条 件 看 到 ，for 循环 结束 后 执行 了 else 语句 块 中 的 内 容 。 
6.7 ”pass 语句 


Python 中 的 pass 是 空 语句 ， 作 用 是 保持 程序 结构 的 完整 性 。 
pass 语句 的 语法 格式 如 下 : 

pass 

pass 不 做 任何 事情 ， 只 是 占 位 语句 ， 例 如 : 


>>> pass 


>>> 


输出 结果 什么 都 没有 做 。 
为 什么 使 用 一 个 什么 都 不 做 的 语句 呢 ? 再 来 看 如 下 代码 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


name='xiaomeng" 
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让 name 一 Xxiaomeng': 
print('hello') 
elif name 一 'xiaozhi': 
# 预 留 ， 先 不 做 任何 处 理 
else: 
print(nothing) 


执行 程序 ， 结 果 如 下 : 


File "itertor.py", line 63 
else: 


A 


IndentationError: expected an indented block 
执行 报错 了 ， 因 为 程序 中 有 空 代码 ， 在 Python 中 空 代码 是 非法 的 。 解 决 办 法 是 在 语句 块 
中 加 一 个 pass 语句 。 上 面 的 代码 更 改 为 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


name='xiaomeng' 

if name 一 'xiaomeng 
print(hello) 

elifname 一 'xiaozhi': 
# 预 留 ， 先 不 做 任何 处 理 
pass 

else: 
print(nothing) 


再 执行 这 段 代 码 ， 得 到 结果 如 下 : 
hello 


输出 结果 可 以 正确 执行 了 。 
6.8 牛刀 小 试 一 一 猜 字 游 戏 编写 


为 巩固 本 章 的 学 习 内 容 ， 设 计 一 个 小 游戏 帮助 我 们 系统 地 温习 本 章 的 知识 点 。 

游戏 内 容 是 这 样 的 ， 随 便 给 定 一 个 在 一 定 范围 内 的 数字 ， 让 用 户 去 猜 这 个 数字 是 多 少 
并 输入 自己 猜测 的 数字 ， 系 统 判 断 是 否 为 给 定数 字 。 如 果 输 入 的 猜测 数字 大 于 给 定 值 , 提示 你 
输入 的 值 大 了 ; 如 果 输 入 的 值 小 于 给 定 值 ， 就 提示 输入 的 值 小 了 ; 如 果 等 于 给 定数 字 ， 就 提示 
你 猜 对 了 ， 并 展示 猜 了 多 少 次 猜 中 了 。 

在 看 参考 代码 之 前 先 思考 一 下 ， 要 实现 这 个 小 游戏 ， 你 会 怎么 做 呢 ? 
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思考 点 拨 : 
先 从 最 简单 的 方向 思考 ， 有 3 种 情况 : 


(1) 输入 值 小 于 给 定 值 。 
(2) 输入 值 等 于 给 定 值 。 
(3) 输入 值 大 于 给 定 值 。 


对 于 情况 (1) 和 (3) ， 需 要 继续 输入 ; 对 于 情况 (2) ， 输 入 结束 。 

需要 提供 3 个 变量 : 一 个 变量 用 于 记录 给 定 值 ， 一 个 变量 用 于 记录 输入 值 ， 一 个 变量 用 
于 记录 输入 了 多 少 次 ， 注 意 输 入 次 数 至 少 是 一 次 。 

参考 代码 如 下 (参考 代码 对 输入 元 素 是 否 为 数字 做 了 判断 ， 同 时 判断 了 输入 数字 是 否 超 
出 给 定 的 数值 范围 ): 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


import random 


number = random randint(1,100) 
guess=0 
while True: 
num_input = input(" 请 输入 一 个 1 到 100 的 数字 :") 
guess +=] 
if not num_input.isdigit(): 
print ("请 输入 数字 。") 
elif int(num _input)<0 or int(num _input)>=100: 
print ("输入 的 数字 必须 介 于 1 到 100。") 
else: 
让 number 一 int(num_input): 
print (" 恭 喜 您 ， 您 猜 对 了 ， 您 总 共 猜 了 %d 次 "%guess) 
break 
elifnumber>intnum_input): 
print ("您 输入 的 数字 小 了 。") 
elifnumber<inttnum_input): 
print ("您 输入 的 数字 大 了 。") 
else: 


print ("系统 发 生 不 可 预测 问题 ， 请 联系 管理 人 员 进 行 处 理 。") 
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6.9 Python 程序 调试 


这 里 通过 设置 的 一 些 错 误 让 读者 认识 在 编写 代码 过 程 中 的 常见 问题 ， 以 帮助 读者 熟悉 和 
解决 实际 遇 到 的 问题 。 

(1) 在 交互 模式 下 输入 false， 看 会 输出 什么 结果 ， 并 尝试 解答 为 什么 输出 这 样 的 结果 。 
输入 true、true+false 呢 ? 





>>> false 
Traceback (most recent call last): 
File "<pyshell#38>", line 1, in <module> 
false 
NameError: name 'false' is not defined 


(2) 在 while 或 for 循环 中 ,尝试 不 对 齐 循环 语句 块 中 的 语句 , 看 看 执行 结果 是 怎样 的 ? 
例如 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


num = 10 
while num > 0: 
print (输出 数字 为 ;, num) 
num -=1 # 本 行 与 其 他 行 不 对 齐 
ifnum 一 8: 
break 


运行 这 段 代 码 ， 查 看 输出 结果 是 怎样 的 ， 并 尝试 更 改 为 for 循环 ， 再 次 查看 结果 。 
(3) 尝试 以 下 程序 的 执行 结果 : 

#! /usr/bin/python3 

#-*- coding:UTF-8 -*- 


name='xiaomeng' 

if name 一 'xiaomeng': 
print(hello) 

elifname 一 'xiaozhi': 
print('do nothing) 

pass 

else: 

print(nothing) 
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6.10 问题 解答 


(1) 能 不 能 像 执行 .exe 文件 一 样 执行 .py 文件 呢 ? 
答 : 在 Windows 上 是 不 行 的 ， 不 过 在 Mac 和 Linux 上 可 以 。 方 法 是 在 .py 文件 的 第 一 行 
加 一 个 特殊 注释 ， 例 如 : 
#!/usr/bin/env python3 


(2) 在 实际 项 目 中 ， 条 件 语句 用 得 多 还 是 循环 语句 用 得 多 ? 

答 : 这 要 看 什么 样 的 项 目 ， 有 一 些 项 目的 功能 用 条 件 语句 更 好 实现 ， 条 件 语句 就 会 用 得 
多 些 。 若 使 用 循环 语句 实现 更 方便 ,就 多 使 用 循环 语句 。 随 着 越 来 越 熟悉 这 些 语句 ,可 以 根据 
自己 的 使 用 习惯 和 具体 需求 做 出 更 好 的 选择 。 


(3) 可 以 在 循环 语句 中 翌 套 循环 吗 ? 

答 : 可 以 ， 循 环 语句 也 可 以 像 条 件 语 句 一 样 嵌 套 循环 语句 。 循 环 语句 不 但 可 以 霸 套 循环 
语句 ， 而 且 可 以 嵌 套 条 件 语句 ， 条 件 语句 中 也 可 以 嵌 套 循环 语句 。 条 件 语 铅 和 循环 语句 的 使 用 
很 灵活 ， 只 要 语法 正确 ， 就 可 以 任意 使 用 。 


6.11 温 故 知 新 ， 学 以 致 用 


本 章 主要 讲解 了 条 件 、 循 环 和 其 他 语句 ， 在 本 章 结束 前 回顾 一 下 学 到 的 概念 。 

(1) import 语句 和 import 语句 的 使 用 。 

(2) 什么 是 序列 解 包 、 链 式 赋值 和 增 量 赋值 ? 

(3) 什么 是 条 件 语句 ? 

(4) 有 哪些 循环 语句 ， 该 怎么 使 用 ， 又 该 怎么 跳出 ? 

尝试 思考 并 解决 如 下 问题 : 

(1) 使 用 本 章 所 学 的 知识 ， 结 合 相 关 资 料 ， 输 出 九 九 乘法 表 。 

(2) 使 用 本 章 的 知识 写 一 个 程序 ， 判 断 输入 的 年 份 是 否 为 闽 年 〈 输 入 函数 为 input) 。 

(3) 写 一 个 函数 判断 输入 的 数字 是 奇数 还 是 偶数 。 

提高 题 

阿姆斯特朗 数 

如 果 一 个 n 位 正 整数 等 于 各 位 数字 nm 次 方 的 和 ,就 称 该 数 为 阿姆斯特朗 数 。 例 如 , 1^3 + 5^3 
+3^3 = 153。 

1000 以 内 的 阿姆斯特朗 数 有 : 1、2、3、4、5、6、7、8、9、153、370、371、407。 

写 一 个 程序 ， 检 测 输 入 的 数字 是 否 为 阿姆斯特朗 数 。 


.141 。 





第 /这 数 


函数 是 组 织 好 的 、 可 重复 使 用 的 , 用 来 实现 单一 或 相关 
联 功能 的 代码 段 。 

函数 能 够 提高 应 用 的 模块 性 和 代码 的 重复 利用 率 。 
Python 提供 了 许多 内 建 函数 ， 如 print0、intO。 读 者 也 可 以 
自己 创建 函数 ， 这 样 的 函数 称 为 用 户 自 定义 函数 。 





A 
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7.1 调用 函数 


在 程序 设计 中 ， 函 数 是 指 用 于 进行 某 种 计算 的 一 系列 语句 的 有 名 称 的 组 合 。 定 义 函 数 时 ， 
需要 指定 函数 的 名 称 并 编写 一 系列 程序 语句 ， 之 后 可 以 使 用 名 称 “ 调 用 ”这 个 函数 。 

前 面 我 们 已 经 介绍 过 函数 调用 ， 例 如 : 

>>> print(hello world) 

hello world 

>>> type('hello') 

<class 'str> 

>>> int(12.1) 

12 


以 上 代码 就 是 函数 的 调用 。 函 数 括号 中 的 表达 式 称 之 为 函数 的 参数 。 函 数 “ 接 收 ” 参 数 ， 
并 “返回 ”结果 ， 这 个 结果 称 为 返回 值 (return value) 。 比 如 上 面 示例 中 的 int(12.1)，12.1 就 
是 “接收 ”的 参数 ， 得 到 的 结果 是 12，12 就 是 返回 值 。 

Python 3 内 团 了 很 多 有 用 的 函数 ， 可 以 直接 调用 。 要 调用 一 个 函数 ， 就 需要 知道 函数 的 名 
称 和 参数 ， 比 如 求 绝 对 值 的 函数 abs 只 有 一 个 参数 。 可 以 直接 从 Python 的 官方 网 站 查看 文档 : 





https://docs.python.org/3/library/functions.html 


进入 官方 网 站 可 以 看 到 如 图 7-1 所 示 的 页 面 , 这 里 显示 了 Python 3 内 置 的 所 有 函数 , abs() 
函数 在 第 一 个 位 置 。 从 左上 角 可 以 看 到 这 个 函数 是 Python 3.5.2 版 本 的 内 置 函 数 。 


Pvthon *[352 »|Documentation » The Python Standard Library » 
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2. Built-in Functions 


Previous topic 


1 toduction 
The Python interpreter has a number of functions and types built into itthat are always available They are listed here in alphabetical order 
Next topic 
3 Builtin Constants 村 Builtin Functions 
aba0 dctO helpO 
This Page al10 lrO nexO 
Report a Bug anyO jiwodO 
OA Souree 
| binO 
Quick search 





floatO 





aaxzO rondO 
dclattrO ashO acaoryvicvD sctO 








7-1 Python 官方 网 站 


单 击 absO0 函 数 ， 页 面 会 跳 到 如 图 7-2 所 示 的 位 置 ， 有 对 absO 函 数 的 说 明 。 截 图 中 的 意思 
是 : 返回 一 个 数 的 绝对 值 。 参数 可 能 是 整数 或 浮 点 数 。 如 果 参 数 是 一 个 复数 , 就 返回 它 的 大 小 。 
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ue of a number The argument may be an inieger or a floating point number If the argument is a complex number its 





7-2 abs0 函 数 帮 助 说 明 


除了 到 Python 官方 网 站 查看 文档 ， 还 可 以 在 交互 式 命令 行 通过 help(abs) 查 看 abs 函数 的 
帮助 信息 。 在 交互 模式 下 输入 : 


>>> help(abs) 
Help on built-in function abs in module builtins: 
abs(x, /) 

Return the absolute value of the argument. 


可 以 看 到 ， 输 出 了 对 应 的 帮助 信息 ， 但 是 没有 官方 网 站 的 详细 。 
下 面 实际 操作 abs() 函 数 ， 在 交互 模式 输入 : 

>>> abs(20) 

20 

>>> abs(-20) 

20 

>>> abs(3.14) 

3.14 

>>> abs(-3.14) 

3.14 


从 上 面 的 输出 结果 可 以 看 出 ，abs 函数 用 于 求 绝对 值 。 
调用 absO 函 数 时 ， 如 果 传 入 的 参数 数量 不 对 ， 就 会 报 TypeError 的 错误 ， Python 会 明确 
告诉 你 : abs0 有 且 只 有 一 个 参数 ， 但 给 出 了 两 个 ， 例 如 : 


>>> abs(5,6) 
Traceback (most recent call last): 
File "<pyshell#171>", line 1, in <module> 
abs(5.6) 
TypeError: abs() takes exactly one argument (2 given) 


如 果 传 入 的 参数 数量 是 对 的 ， 但 参数 类 型 不 能 被 函数 接收 ， 也 会 报 TypeError 的 错误 。 给 
出 错误 信息 : str 是 错误 的 参数 类 型 ， 例 如 : 

>>> abs(hello) 

Traceback (most recent call last): 

File "<pyshell#172>", line 1, in <module> 
abs('hello') 

TypeError: bad operand type for abs(): 'str' 

函数 名 其 实 是 指向 一 个 函数 对 象 的 引用 ， 完 全 可 以 把 函数 名 赋 给 一 个 变量 ， 相 当 于 给 这 
个 函数 起 了 一 个 “别名 ”， 在 交互 模式 下 输入 : 
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>>> fun=abs # 变量 fun 指向 abs 函数 

>>> fun(-5) # 所 以 可 以 通过 fun 调用 abs 函数 

3 

>>> fun(-3.14) # 所 以 可 以 通过 fun 调用 abs 函数 

3.14 

>>> fun(3.14) # 所 以 可 以 通过 fun 调用 abs 函数 

3.14 

调用 Python 中 的 函数 时 ， 需 要 根据 函数 定义 传 入 正确 的 参数 。 如 果 函 数 调用 出 错 ， 就 要 
会 看 错误 信息 ， 这 时 就 要 考验 你 的 英语 水 平 了 。 


7.2 定义 函数 


到 目前 为 止 ， 我 们 用 的 都 是 Python 内 置 函数 。 这 些 Python 内 置 函数 的 定义 部 分 对 我 们 来 
说 是 透明 的 。 因 此 ， 我 们 只 需 关 注 这 些 函 数 的 用 法 ， 而 不 必 关 心 函 数 是 如 何 定义 的 。Python 
支持 自 定义 函数 , 即 由 我 们 自己 定义 一 个 实现 某 个 功能 的 函数 ,下 面 是 自 定义 函数 的 简单 规则 。 

(1) 函数 代码 块 以 def 关键 词 开头 ， 后 接 函数 标识 符 名 称 和 圆 括号 “0”。 

(2) 所 有 传 入 的 参数 和 自 变量 都 必须 放 在 圆 括号 中 ， 可 以 在 圆 括号 中 定义 参数 。 

(3) 函数 的 第 一 行 语句 可 以 选择 性 使 用 文档 字符 串 ， 用 于 存放 函数 说 明 。 

(4) 函数 内 容 以 冒号 开始 ， 并 且 要 缩 进 。 

(5) return [表达 式 ] 结束 函数 ， 选 择 性 返回 一 个 值 给 调用 方 。 不 带 表 达 式 的 return 相当 
于 返回 None。 

Python 定义 函数 使 用 def 关键 字 ， 一 般 格式 如 下 : 

def 函数 名 (参数 列表 ) : 

函数 体 

或 者 更 直观 的 表示 为 : 

def <name>(argl, arg2,... argN): 

<statements> 

函数 的 名 字 必 须 以 字母 开头 ， 可 以 包括 下 划 线 “_”。 和 定义 变量 一 样 ， 不 能 把 Python 的 关 
键 字 定义 成 函数 的 名 字 。 函 数 内 的 语句 数量 是 任意 的 ， 每 个 语句 至 少 有 一 个 空格 的 缩 进 ， 以 表示 
该 语句 属于 这 个 函数 。 函 数 体 必须 保持 缩 进 一 致 ， 因 为 在 函数 中 ， 缩 进 结束 就 表示 函数 结束 。 

现在 已 经 知道 定义 函数 的 简单 规则 和 一 般 格式 了 。 下 面 我 们 进行 实际 操作 ， 在 文本 中 定 
义 函数 并 调用 : 

#! /usr/bin/python3 

#-*- coding:UTF-8 -*- 





def hello0: 
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print(hello.world) 


hello0 

以 上 示例 中 的 hello0 就 是 我 们 自 定义 的 函数 。 此 处 为 了 看 到 执行 结果 , 在 函数 定义 完 后 做 
了 函数 的 自我 调用 。 如 果 不 自我 调用 ,执行 该 函数 就 没有 任何 输出 ， 当 然 也 不 会 报错 (除非 代 
码 有 问题 ) 。 

在 cmd 命令 下 执行 以 上 py 文件， 执行 结果 如 下 : 


Hello,world! 





(1) 没有 return 语句 时 ， 函 数 执行 完毕 也 会 返回 结果 ， 不 过 结果 为 None。 

(2) return None 可 以 简写 为 return。 

(3) 在 Python 中 定义 函数 时 ， 需 要 保持 函数 体 中 同一 层级 的 代码 缩 进 一 致 。 

根据 以 上 示例 ， 是 不 是 一 个 函数 中 只 能 有 一 条 语句 呢 ? 除了 输出 操作 ， 还 能 执行 其 他 操 
作 吗 ? 

在 一 个 函数 中 可 以 输出 多 条 语句 ， 并 能 做 相应 的 运算 操作 ， 以 及 输出 运算 结果 。 

例如 ， 定 义 输出 多 条 语句 的 函数 并 执行 : 

#! /usr/bin/python3 

#-*- coding:UTF-8 -*- 


def printmore(): 
print(' 该 函数 可 以 输出 多 条 语句 ， 我 是 第 一 条 。') 
print(' 我 是 第 二 条 ') 
Print(' 我 是 第 三 条 ') 


printmore() # 调 用 函数 
执行 结果 如 下 : 
该 函数 可 以 输出 多 条 语句 ， 我 是 第 一 条 。 


我 是 第 二 条 

我 是 第 三 条 

定义 输出 数字 和 计算 的 函数 并 执行 : 
#! /usr/bin/python3 

#-*- coding:UTF-8 -*- 


def mixoperation(): 
a=10 
b=20 


.146: 
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print(a) 

Print(b) 

print(a+b) 

print('atb 的 和 等 于 :"a+b) 


mixoperation() ” # 调 用 函数 
执行 结果 如 下 : 

10 

20 

30 

atb 的 和 等 于 : 30 


以 上 示例 验证 了 前 面 的 内 容 。 

定义 一 个 什么 都 不 做 的 函数 可 以 吗 ? 当然 可 以 。 如 果 想 定义 一 个 什么 都 不 做 的 空 函 数 ， 
可 以 用 pass 语句 ， 定 义 如 下 函数 并 执行 : 

#! /usr/bin/python3 

# -#- coding:UTF-8 -*- 


def donothingO: 
pass 


donothing() 


执行 结果 为 没有 任何 输出 。 

pass 语句 什么 都 不 做 ， 有 什么 用 呢 ? 实际 上 pass 可 以 作为 占 位 符 ， 比 如 现在 还 没 想 好 怎 
么 写 函 数 的 代码 ， 可 以 先 放 一 个 pass， 让 代码 能 运行 起 来 。 

函数 的 目的 是 把 一 些 复杂 操作 隐藏 起 来 ， 用 于 简化 程序 的 结构 ， 使 程序 更 容易 阅读 。 函 
数 在 调用 前 必须 先 定义 。 


7.3 ” 国 数 的 参数 


我 们 在 7.2 节 中 讲述 了 如 何 定义 函数 ,不 过 只 讲述 了 定义 简单 函数 ,还 有 一 类 函数 是 带 参 
数 的 ， 称 为 带 参 数 的 函数 。 本 节 将 探讨 如 何 定义 带 参数 的 函数 及 其 使 用 。 
有 函数 时 可 以 使 用 以 下 参数 类 型 : 
(1) 必须 参数 。 
(2) 关键 字 参 数 。 
(3) 默认 参数 。 











苹 





.147 。 
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(4) 可 变 参 数 。 
(5) 组 合 参数 。 


下 面 我 们 分 别 进行 介绍 。 
7.3.1 必须 参数 

必须 参数 必须 以 正确 的 顺序 传 入 函数 。 调 用 时 数量 必须 和 声明 时 一 样 。 

定义 如 下 函数 并 执行 : 


#! /usr/bin/python3 
# -#- coding:UTF-8 -*- 





def paramone(str): 
Print('the param is:',str) 
print(' 我 是 一 个 传 入 参数 ， 我 的 值 是 : ,str) 


paramone('hello,world') 

执行 结果 如 下 : 

the param is: hello,world 

我 是 一 个 传 入 参数 ， 我 的 值 是 : ”hello,world 

我 们 定义 了 一 个 必须 传 入 一 个 参数 的 函数 paramone(str)， 传 入 的 参数 为 str， 结 果 是 将 
“hello,world” 传 给 str。 

对 于 上 例 ， 若 不 传 入 参数 或 传 入 一 个 以 上 的 参数 ， 结 果 会 怎样 呢 ? 例如 : 

paramone() ”# 不 输入 参数 

执行 结果 如 下 : 

Traceback (most recent call last): 

File "<pyshell#208>", line 1, in <module> 


paramone() 
TypeError: paramone() missing 1 required positional argument: 'str' 


执行 结果 告诉 我 们 ， 函 数 缺少 一 个 必需 的 定位 参数 ， 参 数 类 型 为 str。 
paramone('hello','world') ”# 输 入 超过 一 个 参数 
执行 结果 如 下 : 
Traceback (most recent call last): 
File "<pyshell#209>", line 1, in <module> 


paramone(hello ,world) 


TypeError: paramone( takes 1 positional argument but 2 were given 
执行 结果 告诉 我 们 ， 函 数 只 需 一 个 位 置 参 数 却 给 了 两 个 。 
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通过 示例 可 以 看 到 ， 对 于 定义 的 paramone() 函 数 ， 不 传 入 参数 或 传 入 一 个 以 上 参数 ， 都 会 
报错 。 所 以 对 于 此 类 函数 ， 必 须 传递 对 应 正确 个 数 的 参数 。 


7.3.2 ”关键 字 参 数 


关键 字 参 数 和 函数 调用 关系 紧密 ， 函 数 调用 使 用 关键 字 参 数 确定 传 入 的 参数 值 。 

使 用 关键 字 参 数 允 许 调用 函数 时 参数 的 顺序 与 声明 时 不 一 致 , 因为 Python 解释 器 能 够 用 
参数 名 匹配 参数 值 。 

定义 如 下 函数 并 执行 : 

#! /usr/bin/python3 

# -#- coding:UTF-8 -*- 


def personinfo(age,name): 
Print( 年 龄 ，",age) 
print(' 名 称 : "name) 
return 


Print(------- 按 参数 顺序 传 入 参数 -------') 
personinfo(21,' 小 萌 ') 

print(------- 不 按 参数 顺序 传 入 参数 ， 指 定 参 数 名 一 -- 一 -) 
personinfo(name=' 小 萌 ',age=21) 

Print(------- 按 参数 顺序 传 入 参数 ， 并 指定 参数 名 -------') 
personinfo(age=21name= 小 萌 ) 
调用 函数 执行 结果 如 下 : 

------- 按 参数 顺序 传 入 参数 ------- 

年 龄 : 21 

名 称 : 小 萌 

--- 一 -不 按 参 数 顺序 传 入 参数 ， 指 定 参数 名 一- 一- 

年 龄 : 21 

名 称 : 小 萌 

一 -一 -- 按 参数 顺序 传 入 参数 ， 并 指定 参数 名 一 -一 
年 龄 : 21 

名 称 : 小 萌 


由 以 上 输出 结果 可 以 看 到 ， 对 于 personinfo() 函 数 ， 只 要 指定 参数 名 ， 输 入 参数 的 顺序 对 
结果 就 没有 影响 ， 都 能 得 到 正确 的 结果 。 
7.3.3 ”默认 参数 

调用 函数 时 ， 如 果 没 有 传递 参数 ， 就 会 使 用 默认 参数 。 


使 用 默认 参数 ， 就 是 在 定义 函数 时 ， 给 参数 一 个 默认 值 。 如 果 没 有 给 调用 的 函数 的 参数 
赋值 ， 调 用 的 函数 就 会 使 用 这 个 默认 值 。 
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例如 ， 定 义 如 下 函数 并 执行 : 


#! /usr/bin/python3 
# -#- coding:UTF-8 -*- 


def defaultparam(name,age=23): 
print(hi， 我 叫 : "name) 
print(' 我 今年 : "age) 
return 


defaultparam(' 小 萌 ) 


调用 函数 执行 结果 如 下 : 

hi， 我 叫 ， 小 萌 

我 今年 : 23 

从 以 上 示例 我 们 看 到 , 在 函数 调用 时 没有 对 age 赋值 ,在 输出 结果 中 使 用 了 函数 定义 时 的 
默认 值 。 如 果 我 们 对 age 赋值 ， 最 后 输出 结果 会 使 用 哪个 值 呢 ? 
重新 调用 上 面 的 函数 : 

defaultparam(' 小 萌 ',21) # 函 数 默 认 age=23 

得 到 的 执行 结果 如 下 : 

hi, 我 叫 : 小 萌 

我 今年 : 21 

通过 执行 函数 我 们 看 到 ， 执 行 结 果 使 用 的 是 我 们 传 入 的 参数 。 由 此 得 知 : 当 对 默认 参数 
传 值 时 ， 函 数 执行 时 调用 的 是 我 们 传 入 的 值 。 

把 函数 的 默认 参数 放 在 前 面 是 否 可 行 呢 ? 定义 如 下 函数 并 执行 : 

#! /usr/bin/python3 

# -*- coding:UTF-8 -*- 





def defaultparam(age=23,name): 

print(hi， 我 叫 ; 'name) 

print(' 我 今年 : ,age) 

return 

defaultparam(age=21,name=' 小 萌 ') 
执行 结果 如 下 : 
SyntaxError: non-default argument follows default argument 
执行 结果 是 编译 不 通过 ， 错 误 信 息 是 : 非 默 认 参 数 跟 在 默认 参数 后 面 了 。 


sls 
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这 里 提醒 我 们 ， 默 认 参 数 一 定 要 放 在 非 默认 参数 后 面 。 如 果 需 要 多 个 默认 参数 ， 该 怎么 
办 呢 ? 我 们 看 以 下 几 个 函数 定义 的 示例 。 


示例 1: 默认 参数 在 必须 参数 前 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


def defaultparam1(age=23,name,addr='shanghai"): 
print(hi， 我 叫 ， 'name) 
print(' 我 今年 : ,age) 
print(' 我 现在 在 :,addr) 


return 


def defaultparam2(age=23,addr='shanghai' ,name): 
print(hi， 我 叫 ，'name) 
print(' 我 今年 : ,age) 
print(' 我 现在 在 :,addr) 


return 


defaultparam1(age=23, "小 萌 ',addr='shanghai') 
defaultparam2(age=23,addr='shanghai', ' 小 萌 ) 


执行 结果 如 下 报错 了 》: 
SyntaxError: non-default argument follows default argument 
示例 2: 


#! /usr/bin/python3 
# -#- coding:UTF-8 -*- 


def defaultparam(name,age=23,addr='shanghai): 
print(hi， 我 叫 ， ',name) 
print(' 我 今年 : "age) 
print(' 我 现在 在 :,addr) 
return 


Print(--- 一 -- 传 入 必须 参数 --- 一 -) 

defaultparam(' 小 萌 ) 

print(--- 一 -- 传 入 必须 参数 ， 更 改 第 一 个 默认 参数 值 -----) 
defaultparam(' 小 萌 ',21) 

print(--- 一 -- 传 入 必须 参数 ， 默 认 参数 值 都 更 改 --- 一 --) 
defaultparam(' 小 萌 ',21,'beijing') 
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print(--- 一 -- 传 入 必须 参数 ， 指 定 默认 参数 名 并 更 改 参数 值 -一 -一 ) 
defaultparam(' 小 萌 ',addr='beijing') 

print(------- 传 入 必须 参数 ， 指 定 参数 名 并 更 改 值 -----') 
defaultparam(' 小 萌 ',addr='beijing',age=23) 

print(--- 一 -第 一 个 默认 参数 不 带 参数 名 ， 第 二 个 带 -一 -一 ) 
defaultparam(' 小 萌 ',21,addr='beijing') 

print(--- 一 -两 个 默认 参数 都 带 参数 名 -- 一 --) 
defaultparam(' 小 萌 '\,age=23,addr='beijing) 

print(--- 一 -- 第 一 个 默认 参数 带 参 数 名 ， 第 二 个 不 带 ， 报 错 -一 -一 ) 
defaultparam(' 小 萌 ',age=23,'beijing') 

执行 结果 如 下 : 

一 一 -- 传 入 必须 参数 -一 - 

hi, 我 叫 : 小 萌 

我 今年 : 23 

我 现在 在 : shanghai 

--- 一 -- 传 入 必须 参数 ， 更 改 第 一 个 默认 参数 值 ------ 

hi, 我 叫 : 小 萌 

我 今年 : 21 

我 现在 在 : shanghai 

-一 - 传 入 必须 参数 ， 默 认 参 数值 都 更 改 --- 一 -- 

hi, 我 叫 : 小 萌 

我 今年 : 21 

我 现在 在 : beijing 

--- 一 -- 传 入 必须 参数 ， 指 定 默认 参数 名 并 更 改 参 数值 ----- 
hi， 我 叫 : 小 萌 

我 今年 : 23 

我 现在 在 : beijing 

--- 一 -- 传 入 必须 参数 ， 指 定 参数 名 并 更 改 值 ------- 

hi， 我 叫 ， 小 萌 

我 今年 : 23 

我 现在 在 : beijing 

一 一- 第 一 个 默认 参数 不 带 参 数 名 ， 第 二 个 带 ------- 

hi, 我 叫 ， 小 萌 

我 今年 : 21 

我 现在 在 : beijing 

--- 一 -- 两 个 默认 参数 都 带 参 数 名 ------- 

hi， 我 叫 小 萌 

我 今年 : 23 

我 现在 在 : beijing 

一 一- 第 一 个 默认 参数 带 参数 名 ， 第 二 个 不 带 ， 报 错 -一 -一 
SyntaxError positional argument follows keyword argument 





函 数 第 7 党 





从 以 上 执行 结果 可 以 发 现 : 


(1) 无 论 有 多 少 默认 参数 ， 默 认 参 数 都 不 能 在 必须 参数 之 前 。 

(2) 无 论 有 多 少 默 认 参数 ， 若 不 传 入 默认 参数 值 ， 则 使 用 默认 值 。 

(3) 若 要 更 改革 一 个 默认 参数 值 ， 又 不 想 传 入 其 他 默认 参数 ， 且 该 默认 参数 的 位 置 不 是 
第 一 个 ， 则 可 以 通过 参数 名 更 改 想 要 更 改 的 默认 参数 值 。 

(4) 若 有 一 个 默认 参数 通过 传 入 参数 名 更 改 参数 值 ， 则 其 他 想 要 更 改 的 默认 参数 都 需要 
传 入 参数 名 更 改 参 数值 ， 否 则 报错 。 

(5) 更 改 默 认 参 数值 时 ， 传 入 默认 参数 的 顺序 不 需要 根据 定义 的 函数 中 的 默认 参数 的 顺 
序 传 入 ， 不 过 最 好 同时 传 入 参数 名 ， 否 则 容易 出 现 执 行 结果 与 预期 不 一 致 的 情况 。 

通过 以 上 示例 可 以 看 出 ， 默 认 参 数 是 比较 有 用 的 ， 通 过 默认 参数 可 以 帮助 我 们 少 写 不 少 
代码 ， 比 如 使 用 上 面 的 代码 帮助 某 单位 录入 人 员 信 息 ， 如 果 有 很 多 人 的 addr 相同 ， 就 不 需要 
传 入 每 个 人 的 addr 值 了 。 不 过 使 用 默认 参数 时 需要 小 心 谨慎 。 


7.3.4 ”可 变 参数 


如 果 需 要 一 个 函数 能 够 处 理 的 参数 声明 时 更 多 ， 这 些 参 数 叫 作 可 变 参 数 。 和 前 面 所 述 两 
种 参数 不 同 ， 可 变 参数 声明 时 不 会 命名 。 基 本 语法 如 下 : 


def functionname([formal args,] *var args_tuple ): 
"函数 文档 字符 叫 " 
function_suite 
return [expression] 
加 了 星 号 (*) 的 变量 名 会 存放 所 有 未 命名 的 变量 参数 。 如 果 变量 参数 在 函数 调用 时 没有 
指定 参数 ， 就 是 一 个 空 元 组 。 我 们 也 可 以 不 向 可 变 函 数 传递 未 命名 的 变量 。 
下 面 通过 实例 说 明 可 变 函 数 的 使 用 ， 定 义 如 下 函数 并 执行 : 
#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


def personinfo(arg,*vartuple): 
Print(arg) 
for var in vartuple: 


print( 我 属于 不 定 长 参数 部 分 :,var) 








return 
Print(------- 一 --- 不 带 可 变 参数 --- 一 -一 ----- 一 - | 
personinfo(' 小 萌 ) 
Print( 带 两 个 可 变 参数 ---- 一 -- 一 -- 一 一 -0 
personinfo(' 小 萌 ',21,beijing) 
Print(--- 一 -一 -- 带 5 个 可 变 参数 一 -一 -一 -一 -一 ") 


personinfo(' 小 萌 ',21,'beijing',123,'shanghai','happy') 
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执行 结果 如 下 : 

不 带 可 变 参数 
小 萌 
二 -- 带 两 个 可 变 参数 一 -一 
小 本 


我 属于 不 定 长 参数 部 分 : 21 

我 属于 不 定 长 参数 部 分 : beijing 

= 带 5 个 可 变 参 数 -一 -一 -- 

小 萌 

我 属于 不 定 长 参数 部 分 : 21 

我 属于 不 定 长 参数 部 分 : beijing 

我 属于 不 定 长 参数 部 分 : 123 

我 属于 不 定 长 参数 部 分 : shanghai 

我 属于 不 定 长 参数 部 分 : happy 

这 段 代 码 看 起 来 很 不 可 思议 ， 在 定义 函数 时 只 定义 了 两 个 参数 ， 调 用 时 却 可 以 传 入 那么 
多 参数 ， 难 道 该 函数 使 用 了 洪荒 之 力 ? 

这 其 实 就 是 可 变 参数 的 好 处 ， 我 们 在 参数 前 面 加 了 一 个 星 号 ， 在 函数 内 部 ， 参 数 前 的 星 
号 将 所 有 值 放 在 同一 个 元 组 中 ,通过 这 种 方式 将 这 些 值 收集 起 来 ， 然 后 使 用 。 参 数 vartuple 接 
收 的 是 一 个 元 组 ， 调 用 函数 时 可 以 传 入 任意 个 数 的 参数 ， 也 可 以 不 传 。 

在 这 个 示例 中 使 用 了 前 面 所 学 的 for 循环 ， 通 过 for 循环 遍历 元 组 。 

通过 这 种 方式 定义 函数 ， 调 用 时 是 不 是 非常 方便 ? 我 们 在 后 续 学 习 中 会 经 常 遇 到 。 

也 可 以 使 用 这 种 方式 处 理 前 面 学 习 的 关键 字 参 数 ， 例 如 : 

other = 城市: ' 北 京 ,' 爱 好 ': ' 编 程 '} 

def personinfo(name, number, **kw): 

print(' 名 称 :, name, ' 学 号: number, ' 其 他 :', kw) 


personinfo(' 小 智 ', 1002， 城 市 =other[' 城 市 ], 爱好 =other[' 爱 好 ']) 

函数 执行 结果 为 : 

名 称 : 小 智 学 号 : 1002 其 他 : {' 爱 好 ': 编程 ', ' 城 市 ': 北京 人 

由 函数 执行 结果 看 到 ， 可 以 使 用 两 个 “*” 号 ， 即 使 用 “**” 处 理 关键 字 参 数 。 函 数 调用 
时 可 以 用 更 简单 的 方式 调用 ， 简 单 形式 如 下 : 

personinfo(' 小 智 ', 1002, **other) 

函数 执行 结果 为 : 

名 称 : 小 智 学 号 : 1002 其 他 : {' 爱 好 ': 编程 ', 城市 ': 北京 4 

执行 结果 和 前 面 一 样 ， 写 法 上 却 简单 了 不 少 。 此 处 **other 表示 把 other 这 个 字典 的 所 有 
key-value 用 关键 字 参 数 传 入 到 函数 的 **kw 参数 ，kw 将 获得 一 个 字典 , 注意 kw 获得 的 字典 是 
other 复制 的 ， 对 kw 的 改动 不 会 影响 函数 外 的 other。 
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7.3.5 组合 参数 


在 Python 中 定义 函数 可 以 用 必须 参数 、 关 键 字 参 数 、 默 认 参 数 和 可 变 关 键 字 参 数 ， 这 4 种 
参数 可 以 组 合 使 用 。 注 意 定义 参数 的 顺序 必须 是 必须 参数 、 默 认 参 数 、 可 变 参数 和 关键 字 参 数 。 
下 面 介绍 组 合 参数 的 使 用 ， 请 看 如 下 函数 定义 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


def exp(p1, p2, df=0, *vart, **kw): 
print(p1 =, pl, 'p2=, p2, "df=", df ‘vart=", vart, kw = kw) 


exp(1,2) 

exp(1,2,c=3) 

exp(1,2,3,'a','b') 

exp(1,2,3,abc',x=9) 

函数 执行 结果 如 下 : 

pl=1p2=2 df 0var=0Okw= 0 

pl=1p2=2 df=0var=0O kw= {'c: 3} 

pl=1p2=2 df=3 vart=(a,'b)kw={} 

pl=1p2=2 df=3 vart= (abc',,) kw = {x': 9} 

由 输出 结果 看 到 ， 使 用 了 组 合 参数 ， 在 调用 函数 时 ，Python 解释 器 会 自动 按照 参数 位 置 
和 参数 名 把 对 应 的 参数 传 进去 。 

此 处 还 可 以 用 tuple 和 dict 调用 上 述 函数 ， 使 用 方式 如 下 : 


args=(1, 2, 3, 4) # 定 义 tuple 
kw = {x': 8, y:'9'} # 定 义 dict 
exp(*args, **kw) 

执行 结果 如 下 : 


pl =1p2=2 df= 3 vart= (4,) kw = {'y': '9', x': 8} 
由 执行 结果 看 到 ， 任 意 函 数 都 可 以 通过 类 似 func(*args,**kw) 的 形式 调用 ， 无 论 参 数 是 如 
何 定义 的 。 


7.4 执行 流程 


我 们 前 面 列举 了 不 少 函 数 的 示例 ， 不 过 对 于 函数 的 执行 流程 还 需要 进一步 了 解 ， 以 便 在 
后 续 章节 中 学 习 得 更 轻松 。 





Python 3.5 从 零 开 始 学 





为 了 保证 函数 的 定义 先 于 首次 调用 执行 ， 我 们 需要 知道 语句 的 执行 顺序 ， 即 执行 流程 。 

执行 总 是 从 程序 的 第 一 行 代码 开始 ， 从 上 到 下 、 从 左 到 右 ， 按 顺序 依次 执行 第 一 条 语句 。 

函数 定义 并 不 会 改变 程序 的 执行 流程 ， 不 过 函数 代码 块 中 的 语句 并 不 是 立即 执行 ， 而 是 
等 函数 被 程序 调用 时 才 执 行 。 

函数 调用 可 以 看 作 程 序 执行 流程 中 的 一 个 迁 回路 径 ， 遇 到 函数 调用 时 ， 并 不 会 直接 继续 
执行 下 一 条 语句 , 而 是 跳 到 函数 体 的 第 一 行 , 继续 执行 完 函数 代码 块 中 的 所 有 语句 ,再 跳 回 原 
来 离开 的 地 方 。 

这 样 看 似 比较 简单 ， 但 是 会 发 现 函 数 代码 块 中 可 以 调用 其 他 函数 ， 当 程序 流程 运行 到 一 
个 函数 时 ， 可 能 需要 执行 其 他 函数 中 的 语句 。 但 当 执行 这 个 函数 的 语句 时 ， 又 可 能 需要 调用 执 
行 另 一 个 函数 的 语句 。 

幸好 Python 对 于 程序 运行 到 哪里 有 很 好 的 记录 ， 所 以 在 每 个 函数 执行 结束 后 ， 程 序 都 能 
跳 回 它 离开 的 地 方 ， 直 到 执行 到 整个 程序 的 结尾 才 会 结束 。 

当 我 们 看 别人 的 Python 代码 时 ， 不 一 定 要 一 行 一 行 按照 书写 顺序 阅读 ， 有 时 按照 执行 的 
流程 阅读 更 好 理解 代码 的 含义 。 





7.5“ 形 参 和 实 参 


我 们 前 面 已 经 讲述 过 函数 的 参数 ， 本 节 将 给 大 家 介绍 Python 函数 的 两 种 类 型 参数 ， 一 种 
是 函数 定义 里 的 形 参 ， 一 种 是 调用 函数 时 传 入 的 实 参 。 

经 常 在 使 用 一 些 内 置 函数 时 需要 传 入 参数 , 如 调用 math.sin 时 , 需要 传 入 一 个 整 型 数字 作 
为 实 参 。 有 的 函数 需要 多 个 参数 ， 如 math.pow 需要 两 个 参数 ， 一 个 是 基数 (base) ， 另 一 个 
是 指数 (exponent) 。 

在 函数 内 部 ， 会 将 实 参 的 值 赋 给 形 参 ， 例 如 : 

#! /usr/bin/python3 

#-*- coding:UTF-8 -*- 


def personinfo(age,name): 
print(' 年 龄 ，',age) 
print(' 名 称 : "name) 
return 


在 该 函数 中 ， 函 数 名 personinfo 后 面 的 参数 列表 age 和 name 就 是 实 参 ， 在 函数 体 中 分 别 
将 age 和 name 的 值 传递 给 age 和 name， 函 数 体 中 的 age 和 name 就 是 形 参 。 


(3 在 函数 体内 都 是 对 形 参 进 行 操作 ， 不 能 操作 实 参 ， 即 对 实 参 做 出 更 改 。 
提示 

内 置 函 数 的 组 合 规则 在 自 定义 函数 上 同样 适用 。 例 如 ,我 们 对 自 定义 的 personinfo 函数 可 
以 使 用 任何 表达 式 作 为 实 参 : 
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personinfo(21,' 小 萌 *2) 

执行 结果 如 下 : 

年 龄 : 21 

名 称 : 小 萌 小 萌 

由 执行 结果 看 到 ， 可 以 用 字符 串 的 乘法 表达 式 作为 实 参 。 

在 Python 中 ， 作 为 实 参 的 表达 式 会 在 函数 调用 前 执行 。 例 如 ， 在 上 面 的 示例 中 ， 实 际 上 
先 执行 ' 小 萌 '*2 的 操作 ， 将 执行 的 结果 作为 一 个 实 参 传递 到 函数 体 中 。 


(2 作为 实 参 传 入 函数 的 变量 名 称 和 函数 定义 里 形 参 的 名 字 没 有 关系 .函数 只 关心 形 参 的 什 ， 
而 不 关心 它 在 调用 前 叫 什么 名 字 。 


7.6 变量 作用 域 


简单 来 说 ， 作 用 域 就 是 一 个 变量 的 命名 空间 。 在 Python 中 ， 程 序 的 变量 并 不 是 在 任何 位 
置 都 可 以 访问 的 , 访问 权限 决定 于 这 个 变量 是 在 哪里 赋值 的 , 代码 中 变量 被 赋值 的 位 置 决 定 哪 
些 范围 的 对 象 可 以 访问 这 个 变量 ， 这 个 范围 就 是 命名 空间 。 

变量 的 作用 域 决定 哪 一 部 分 程序 可 以 访问 特定 的 变量 名 称 。Python 中 有 两 种 最 基本 的 变 
量 作用 域 : 局 部 变量 和 全 局 变量 。 

下 面 我 们 分 别 对 两 种 作用 域 的 变量 进行 介绍 。 


7.6.1 局 部 变量 
在 函数 内 定义 的 变量 名 只 能 被 函数 内 部 引用 ， 不 能 在 函数 外 引用 ， 这 个 变量 的 作用 域 是 


局 部 的 ， 也 称 为 局 部 变量 。 
定义 的 变量 如 果 是 在 函数 体 中 第 一 次 出 现 ， 就 是 局 部 变量 ， 例 如 : 
#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


def func(): 

X= 100 

Print x 

在 func 函数 中 ，x 是 在 函数 体 中 被 定义 的 ， 并 且 是 第 一 次 出 现 ， 所 以 x 是 局 部 变量 。 
局 部 变量 只 能 在 函数 体 中 被 访问 ， 超 出 函数 体 的 范围 访问 就 会 报错 ， 例 如 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


def func(): 


.157 。 





Python 3.5 从 零 开 始 学 





中 ， 


x=100 

print (变量 x: %s' % x) 
print(' 函 数 体外 访问 变量 x: %s' % x) 
func() 


函数 执行 结果 如 下 : 
Traceback (most recent call last): 

File "D:/python/workspace/functiondef.py", line 7, in <module> 

print(' 函 数 体外 访问 变量 x: %s' % (x)) 

NameError: name 'x' is not defined 
执行 结果 告诉 我 们 ， 第 7 行 的 x 没有 定义 ， 由 输入 代码 可 知 ， 第 7 行 语句 没有 在 函数 体 
因而 执行 时 报错 了 。 
如 果 把 x 作为 实 参 传 入 函数 体 中 , 在 函数 体 中 不 定义 变量 x, 会 将 x 认为 是 怎样 的 变量 呢 ? 


定义 如 下 函数 并 执行 : 


| 
里 ， 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


def func(x): 
print (局 部 变量 x 为 ',x) 
func(10) 


函数 执行 结果 如 下 : 
局 部 变量 x 为 : 10 


由 执行 结果 看 到 ， 输 出 了 局 部 变量 的 值 。 这 里 有 一 个 疑问 ， 在 函数 体 中 没有 定义 局 部 变 
x 只 是 作为 一 个 实 参 传 入 函数 体 中 ， 怎 么 变 成 局 部 变量 了 呢 ? 这 是 因为 参数 的 工作 原理 类 


似 于 局 部 变量 ， 一 旦 进入 函数 体 ， 就 成 为 局 部 变量 了 。 


如 果 在 函数 外 定义 了 变量 x 并 赋值 ， 在 函数 体 中 能 否 使 用 x 呢 ? 定义 如 下 函数 并 执行 : 
#! /usr/bin/python3 
#-* coding:UTF-8 -*- 


了 到 30 
def func(): 
print(x 等 于 ', x) 
执行 结果 如 下 : 
x 等 于 50 


由 执行 结果 看 到 , 在 函数 体 中 可 以 直接 使 用 函数 体外 的 变量 (全 局 变量 , 在 7.6.2 小 节 介绍 )。 
如 果 在 函数 外 定义 了 变量 x 并 赋值 ， 将 x 作为 函数 的 实 参 ， 在 函数 体 中 更 改 x 的 值 ， 函 


数 体外 x 的 值 是 否 跟着 变更 呢 ? 定义 如 下 函数 并 执行 : 
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#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


x=50 
def func(x): 
print(x 等 于 ', x) 
x=2 
print(' 局 部 变量 x 变 为 , x) 
func(x) 
print(x 一 直 是 ', x) 
执行 结果 如 下 : 
x 等 于 50 


局 部 变量 x 变 为 2 
x 一 直 是 50 


由 输出 结果 看 到 ， 在 函数 体 中 更 改变 量 的 值 并 不 会 更 改 函 数 体外 变量 的 值 。 这 是 因为 调 


用 func 函数 时 创建 了 新 的 命名 空间 ， 它 作用 于 func 函数 的 代码 块 。 赋 值 语句 x=2 只 在 函数 体 
的 作用 域内 起 作用 ， 不 能 影响 外 部 作用 域 中 的 x。 可 以 看 到 ， 函 数 外 部 调用 x 时 ， 它 的 值 并 没 
有 改变 。 


7.6.2 全 局 变量 


在 函数 外 ， 一 段 代码 最 开始 赋值 的 变量 可 以 被 多 个 函数 引用 ， 这 就 是 全 局 变量 。 全 局 变 


量 可 以 在 整个 程序 范围 内 访问 。 
我 们 在 前 面 已 经 使 用 过 全 局 变量 ,7.6.1 小 节 中 x=50 就 是 全 局 变量 。 
的 示例 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


total = 0; # 这 是 一 个 全 局 变量 
def sum( argl, arg2 ): 


total = argl + arg2; # total 在 这 里 是 局 部 变量 . 
print ("函数 内 是 局 部 变量 : ", total) 


return total 


def totalprint(): 
print('total 的 值 是 ',total) 
return total 


print(' 函 数 求 和 结果 :',sum( 10, 20 )) 


totalprint() 


print ("函数 外 是 全 局 变量 :", total) 


下 面 看 一 个 全 局 变量 
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执行 结果 如 下 : 
函数 内 是 局 部 变量 : 30 
函数 求 和 结果 : 30 

total 的 值 是 0 
函数 外 是 全 局 变量 : 0 


由 执行 结果 看 到 ， 全 局 变量 可 在 全 局 使 用 ， 在 函数 体 中 更 改 全 局 变量 的 值 不 会 影响 全 局 
变量 在 其 他 函数 或 语句 中 的 使 用 。 

我 们 再 看 一 个 函数 定义 并 执行 的 示例 : 

#! /usr/bin/python3 

#-*- coding:UTF-8 -*- 


num = 100 
def func(): 
num = 200 
print(' 函 数 体 中 num 的 值 为 : 'num) 


func() 
print(' 函 数 外 num 的 值 为 : "num) 


函数 执行 结果 为 : 


函数 体 中 num 的 值 为 : 200 
函数 外 num 的 值 为 : 100 


由 输出 结果 看 到 ， 我 们 定义 了 一 个 名 为 num 的 全 局 变量 ， 在 函数 体 中 也 定义 了 一 个 名 为 
num 的 全 局 变量 ,在 函数 体 中 使 用 的 是 函数 体 中 的 num 变量 ， 在 函数 体外 使 用 num 变量 时 使 
用 的 是 全 局 变量 的 值 。 

由 此 我 们 得 知 : 函数 中 使 用 某 个 变量 时 ， 如 果 该 变量 名 既 有 全 局 变量 又 有 局 部 变量 ， 就 
默认 使 用 局 部 变量 。 

要 将 全 局 变量 变 为 局 部 变量 ， 只 需 在 函数 体 中 定义 一 个 和 局 部 变量 名 称 一 样 的 变量 即 可 。 
能 否 将 函数 体 中 的 局 部 变量 变 为 全 局 变量 呢 ? 定义 如 下 函数 并 执行 : 

#1 /ust/bin/python3 

# -*- coding:UTF-8 -*- 


num= 100 
print(' 函 数 调 用 前 num 的 值 为 : ',num) 
def func(): 

global num 

num =200 

print(' 函 数 体 中 num 的 值 为 : ,num) 
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func() 
print(' 函 数 调用 结束 后 num 的 值 为 : ,num) 


函数 执行 结果 如 下 : 
函数 调用 前 num 的 值 为 : 100 


函数 体 中 num 的 值 为 : 200 
函数 调用 结束 后 num 的 值 为 : 200 


由 函数 定义 及 执行 结果 看 到 ， 在 函数 体 中 的 变量 num 前 加 了 一 个 global 关键 字 后 ， 函 数 
调用 结束 后 ， 在 函数 外 使 用 num 变量 时 ， 值 变 为 和 函数 体 中 的 值 一 样 了 。 

由 此 我 们 得 知 : 要 在 函数 中 将 某 个 变量 定义 为 全 局 变量 ， 在 需要 被 定义 的 变量 前 加 一 个 
关键 字 global 即 可 。 

在 函数 体 中 定义 global 变量 后 ， 在 函数 体 中 对 变量 做 的 其 他 操作 也 是 全 局 性 的 。 定 义 如 
下 函数 并 执行 : 

#! /ust/bin/python3 

# -#- coding:UTF-8 -*- 


num = 100 
print(' 函 数 调 用 前 num 的 值 为 : "num) 
def func(): 

global num 

num =200 

num += 100 


print(' 函 数 体 中 num 的 值 为 : "num) 
func() 
print(' 函 数 调用 结束 后 num 的 值 为 : ,num) 
函数 执行 结果 如 下 : 
函数 调用 前 num 的 值 为 : 100 


函数 体 中 num 的 值 为 : 300 
函数 调用 结束 后 num 的 值 为 : 300 


由 执行 结果 看 到 ， 在 函数 体 中 对 定义 的 全 局 变量 num 做 了 一 次 加 100 的 操作 ，num 的 值 
由 原来 的 200 变 为 300， 在 函数 体外 获得 的 num 的 值 也 变 为 300 了 。 


7.7 有 返回 值 和 无 返回 值 函 数 


前 面 在 定义 函数 时 ,有 些 函数 使 用 了 retum 语句, 有 些 函 数 没有 使 用 return 语句 , 使 用 retum 
语句 与 不 使 用 return 语句 有 什么 区 别 呢 ? 
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由 7.2 节 我 们 知道 ， 若 定义 函数 时 没有 使 用 return 语句 ， 则 默认 返回 一 个 None。 要 返回 
一 个 None, 可 以 只 写 一 个 return, 但 要 返回 具体 的 数值 ， 就 需要 在 return 后 面 加 上 需要 返回 的 
内 容 。 对 于 函数 的 定义 来 说 ， 使 用 return 语句 可 以 向 外 提供 该 函数 执行 的 一 些 结果 ; 对 于 函数 
调用 者 来 说 , 是 否 可 以 使 用 函数 中 执行 的 一 些 操作 结果 ,就 在 于 函数 是 否 使 用 return 语句 返 
回 了 对 应 的 执行 结果 。 

在 Python 中 ,有 的 函数 会 产生 结果 (如 数学 函数 ), 我 们 称 这 种 函数 为 有 返回 值 函数 (fruitful 
function) ; 有 的 函数 执行 一 些 动作 后 不 返回 任何 值 ， 我 们 称 这 类 函数 为 无 返回 值 函数 。 

当 我 们 调用 有 返回 值 函数 时 ， 可 以 使 用 返回 的 结果 做 相关 操作 ; 当 我 们 使 用 无 返回 值 或 
返回 None 的 函数 时 ， 只 能 得 到 一 个 None 值 。 

比如 定义 如 下 函数 并 执行 : 

#! /usr/bin/python3 

#-*- coding:UTF-8 -*- 

















def noreturn(): 
print(moretum 函数 不 写 return 语句 ) 
return 
def justreturn(): 
print('justreturn 函数 只 写 return， 不 返回 具体 内 容 ') 


def returnval(): 
x=10 
y=20 
z=xty 
print(returnval 函数 写 return 语句 ， 并 返回 求 和 的 结果 。') 


returnz 


print(' 函 数 noreturn 调用 结果 : ',noretum()) 
print(' 函 数 justretum 调用 结果 : 'justreturn()) 
Print(' 函 数 returnval 调用 结果 : ',retumval()) 
函数 执行 结果 如 下 : 

noreturn 函数 不 写 retum 语句 

函数 noreturn 调用 结果 : ”None 

justreturn 函数 只 写 retum， 不 返回 具体 内 容 

函数 justretum 调用 结果 : ”None 

retumval 函数 写 return 语句 ， 并 返回 求 和 的 结果 。 
函数 returnval 调用 结果 : 30 


由 执行 结果 看 到 ， 定 义 函 数 时 不 写 return 或 只 写 一 个 return 语句 返回 的 都 是 None。 如 果 
写 了 返回 具体 内 容 ， 调 用 函数 时 就 可 以 获取 具体 内 容 。 
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7.8 ”为 什么 要 有 函数 


随 着 函数 学 习 的 不 断 深入 ， 不 知 你 是 否 有 这 样 的 疑问 ， 为 什么 要 有 函数 ， 定 义 函 数 的 好 
处 在 哪里 ? 

我 们 前 几 章 都 是 在 交互 模式 下 编码 的 ， 代 码 量 不 大 ， 操 作 也 不 复杂 ， 在 交互 模式 下 操作 
没什么 问题 ， 唯 一 一 点 就 是 不 能 保存 操作 记录 。 随 着 代码 量 越 来 越 大 , 在 交互 模式 下 操作 就 不 
方便 了 ， 后 面 我 们 引入 了 在 文本 中 编辑 程序 ， 在 cmd 命令 下 执行 的 方式 。 

使 用 文本 结合 cmd 命令 的 方式 可 以 帮助 我 们 记录 历史 记录 ， 并 能 更 简洁 地 进行 代码 的 编 
辑 。 不 过 在 第 6 章 的 学 习 中 我 们 体会 到 ,代码 行 数 达到 一 定量 时 , 把 所 有 代码 都 放 在 一 起 的 方 
式 写 起 来 和 看 起 来 都 有 一 些 难 度 。 

引入 函数 后 ， 在 编写 代码 的 过 程 中 ， 可 以 将 一 些 实现 写成 对 应 的 函数 ， 通 过 调用 函数 做 
后 续 操 作 ， 并 且 可 以 重复 调用 ， 使 得 代码 更 简洁 、 易 读 ， 一 些 代码 也 可 以 重复 使 用 了 。 

对 函数 的 好 处 概括 如 下 : 

(1) 新 建 一 个 函数 ， 让 我 们 有 机 会 为 一 组 语句 命名 ， 成 为 一 个 代码 块 ， 这 样 更 有 利于 阅 
读 代 码 ， 并 且 组 织 后 的 代码 更 容易 调试 。 

(2) 函数 方法 可 以 减少 重复 代码 的 使 用 ， 让 程序 代码 总 行 数 更 少 ， 之 后 修改 代码 时 只 需 
要 少量 修改 就 可 以 了 。 

(3) 将 一 个 很 长 的 代码 片段 拆 分 成 几 个 函数 后 ， 可 以 对 每 一 个 函数 进行 单独 调试 ， 单 个 
函数 调试 通过 后 ， 再 将 它们 组 合 起 来 形成 一 个 完整 的 产品 。 

(4) 一 个 设计 良好 的 函数 可 以 在 很 多 程序 中 复 用 ， 不 需要 重复 编写 。 





7.9 返回 函数 


我 们 前 面 讲解 了 函数 可 以 有 返回 值 ， 除 了 返回 值 ， 函 数 中 是 否 可 以 返回 函数 呢 ? 
例如 ， 函 数 定义 如 下 : 

#! /usr/bin/python3 

#-*- coding:UTF-8 -*- 





def calc_sum(*args): 
ax=0 
for n in args: 
ax=ax+n 


return ax 


这 里 定义 了 一 个 可 变 参数 的 求 和 函数 ， 该 函数 允许 传 入 多 个 参数 ， 最 后 返回 求 得 的 和 。 
如 果 不 需要 立刻 求 和 , 而 是 在 后 面 的 代码 中 根据 需要 再 计算 , 怎么 办 呢 ? 例如 , 函数 定义 如 下 : 
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#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


def sum late(*args): 
def calc_sum(): 
ax=0 
for n in args: 
ax=ax+n 
Teturn ax 


return calc_sum 


可 以 看 到 ， 此 处 返回 了 一 个 我 们 之 前 没有 看 过 的 类 型 的 值 ， 是 返回 了 一 个 函数 吗 ? 是 的 ， 
此 处 确实 返回 了 一 个 函数 。 对 于 此 处 定义 的 函数 , 我 们 没有 返回 求 和 的 结果 , 而 是 返回 了 一 个 
求 和 函数 。 

操作 执行 函数 : 

print(' 调 用 sum_late 的 结果 : "sum_late(1,2,3.4)) 

calc_sum=sum late(1,2,3,4) 

print(' 调 用 calc_sum 的 结果 : ',cale_sum()) 


得 到 函数 的 执行 结果 如 下 : 

调用 sum_late 的 结果 : ”<function sum_late.<locals>.calc_sum at 0x000000000077DE18> 

调用 calc_sum 的 结果 : ”10 

由 执行 结果 看 到 ， 调 用 定义 的 函数 时 没有 直接 返回 求 和 结果 ， 而 是 返回 了 一 上 串 字符 (这 
个 字符 其 实 就 是 函数 ) 。 当 执行 返回 的 函数 时 ， 才 真正 计算 求 和 的 结果 。 

在 这 个 例子 中 ， 在 函数 sum_late 中 又 定义 了 函数 calc_ sum， 并 且 内 部 函数 calc_sum 可 以 
引用 外 部 函数 sum_late 的 参数 和 局 部 变量 。 当 sum_late 返回 函数 calc_sum 时 ， 相 关 参 数 和 变 
量 都 保存 在 返回 的 函数 中 ， 称 为 闭 包 〈Closure) 。 这 种 程序 结构 威力 极 大 。 

有 一 点 需要 注意 ， 当 调用 sum_late0) 函 数 时 ， 每 次 调用 都 会 返回 一 个 新 的 函数 ， 即 使 传 入 
相同 的 参数 也 是 如 此 ， 例 如 : 

fl=sum late(1,2,3) 

f2=sum late(1,2,3) 

print('fl 一 亿 的 结果 为 : ,fl 一 人 2) 


执行 结果 如 下 : 

位 一 亿 的 结果 为 : False 

由 执行 结果 看 到 ， 返 回 的 函数 fl 和 也 不同。 

我 们 在 此 处 提 到 了 闭 包 〈Closure) ， 什 么 是 闭 包 呢 ? 

闭 包 的 定义 : 如 果 在 一 个 内 部 函数 里 对 外 部 函数 〈 不 是 在 全 局 作用 域 ) 的 变量 进行 引用 ， 
内 部 函数 就 被 认为 是 闭 包 。 
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在 上 面 的 示例 中 ， 返 回 的 函数 在 定义 内 部 引用 了 局 部 变量 args， 当 函数 返回 一 个 函数 后 ， 
内 部 的 局 部 变量 会 被 新 函数 引用 。 

我 们 定义 一 个 函数 : 

#! /usr/bin/python3 

# -#- coding:UTF-8 -*- 


def count(|): 
全 = 
foriin range(1, 4): 
def f(): 
Teturn i*i 
fs.append(f) 
return fs 


fl, f2,f3 = count) 

该 示例 中 ， 每 次 循环 都 会 创建 一 个 新 函数 ， 最 后 把 创建 的 3 个 函数 都 返回 了 。 执 行 该 函 
数 得 到 结果 是 怎样 的 呢 ? 调用 flO、B0 和 f30 的 结果 是 1、4、9 吗 ? 

我 们 如 下 执行 函数 : 

print(fl 的 结果 是 : ',f10) 

print( 人 2 的 结果 是 : "人 0) 

print(f3 的 结果 是 : ',f30) 

执行 结果 如 下 : 

f1 的 结果 是 : 9 

他 的 结果 是 : 9 

f3 的 结果 是 : 9 

由 执行 结果 看 到 ，3 个 函数 返回 的 结果 都 是 9， 怎么 全 是 9 呢 ? 

原因 在 于 返回 的 函数 引用 了 变量 i， 但 它 并 非 立刻 执行 。 等 到 3 个 函数 都 返回 时 ， 它 们 所 
引用 的 变量 i 已 经 变 成 了 3， 因此 最 终结 果 为 9。 


返回 财 包 时 ， 返 回 函数 不 要 引用 任何 循环 变量 或 后 续 会 发 生变 化 的 变量 ， 否 则 很 容易 出 
注 意 现 你 意 想不到 的 问题 。 


如 果 一 定 要 引用 循环 变量 怎么 办 呢 ? 
我 们 定义 如 下 函数 并 执行 : 

#! /usr/bin/python3 

#-*- coding:UTF-8 -*- 


def countO: 
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def f0): 

def g(): 

Teturn j*] 

return g 
印 =0 
for iin range(1, 4): 

fs.append(f(i)) #f(i) 立 刻 被 执行 ， 因 此 i 的 当前 值 被 传 入 f0 
return fs 


fl, 亿 , 全 = countO 

print(f1 的 结果 是 : 'f1O) 
print( 人 2 的 结果 是 : ",f20) 
print(' 人 3 的 结果 是 : "f30) 


函数 执行 结果 如 下 : 

f1 的 结果 是 : 1 

他 的 结果 是 : 4 

f3 的 结果 是 : 9 

由 执行 结果 看 到 ， 这 次 输出 结果 和 我 们 预期 的 一 致 。 此 处 的 代码 看 起 来 有 点 费力 ， 大 家 
可 以 想 想 其 他 更 好 的 办 法 。 


7.10 ”递归 函数 


我 们 前 面 学 习 了 在 函数 中 返回 函数 ， 也 学 习 了 在 一 个 函数 中 调用 另 一 个 函数 ， 函 数 是 否 
可 以 调用 自己 呢 ? 答案 是 可 以 的 。 如 果 一 个 函数 在 内 部 调用 自身 ， 这 个 函数 就 称 作 递归 函数 。 
递归 函数 的 简单 定义 如 下 : 
def recurision(): 
return recursion() 


这 只 是 一 个 简单 定义 ， 什 么 也 做 不 了 。 

当然 ， 你 可 以 尝试 会 发 生 什么 结果 。 理 论 上 会 永远 运行 下 去 ， 但 实际 操作 时 可 能 不 一 会 
儿 程 序 就 崩溃 了 (发 生 异常 》。 因 为 每 次 调用 函数 都 会 用 掉 一 点 内 存 ， 在 足够 多 的 函数 调用 发 
生 后 ， 空 间 几 乎 被 占 满 ， 程 序 就 会 报 异常 。 

这 类 递归 被 称 作 无 穷 递 归 (infinite recursion) ， 理 论 上 永远 不 结束 。 当 然 ， 我 们 需要 能 实 
际 做 事情 的 函数 ， 有 用 的 递归 函数 应 该 满足 如 下 条 件 : 


(1) 当 函 数 直接 返回 值 时 有 基本 实例 〈 最 小 可 能 性 问题 ) 。 
(2) 递归 实例 ， 包 括 一 个 或 多 个 问题 最 小 部 分 的 递归 调用 。 
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使 用 递归 关键 在 于 将 问题 分 解 为 小 部 分 ， 递 归 不 能 永远 继续 下 去 ， 因 为 它 总 是 以 最 小 可 
能 性 问题 结束 ， 而 这 些 问 题 又 存储 在 基本 实例 中 。 

函数 调用 自身 怎么 实现 呢 ? 

其 实 函 数 每 次 被 调用 时 都 会 创建 一 个 新 命名 空间 ， 也 就 是 当 函 数 调用 “自身 ”时 ， 实 际 
上 运行 的 是 两 个 不 同 的 函数 〈 也 可 以 说 一 个 函数 具有 两 个 不 同 的 命名 空间 ) 。 

我 们 来 看 一 个 递归 示例 ， 计 算 阶 乘 m = 1X2X3X.…Xn， 用 函数 fact(n) 表 示 ， 可 以 看 出 : 


fact(n)=n!=1X2X3X...X(n-l)Xn=(n-1)!xn=fact(n-1)Xn 


所 以 ，fact(n) 可 以 表示 为 nXfact(n-1)， 只 有 n=1 时 需要 特殊 处 理 。 
于 是 ，fact(n) 用 递归 方式 定义 函数 如 下 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


def fact(n): 
ifn=—=!1: 
return 1 
return n * fact(n - 1) 


执行 该 函数 : 

print(' 调 用 递归 函数 执行 结果 为 : "fact(5)) 
执行 结果 如 下 : 

调用 递归 函数 执行 结果 为 : 120 


由 执行 结果 看 到 ， 函 数 已 正确 输出 5 的 阶乘 的 结果 。 
计算 fact(5) 时 可 以 根据 函数 定义 看 到 计算 过 程 : 


= 一 > fact(5) 

=—> 5 * fact(4) 

=—> 5 * (4 *fact(3)) 

=—> 5 * (4 * (3 * fact(2))) 
=—> 5 * (4 * (3 * (2 * fact(1))) 
=—>5*(4*(3*(2+1)) 
= 
=—>5*(4*6) 

= 一 > 5*+ 24 

= 一 > 120 


由 函数 定义 可 以 得 知 ， 递 归 函 数 的 优点 是 定义 简单 、 逻 辑 清晰 。 

理论 上 ， 所 有 递归 函数 都 可 以 写成 循环 的 方式 ， 不 过 循环 的 逻辑 不 如 递归 清晰 。 

使 用 递归 函数 需要 注意 防止 栈 溢出 。 在 计算 机 中 ， 函 数 调用 是 通过 栈 (stack) 这 种 数据 
结构 实现 的 。 每 当 进 入 一 个 函数 调用 , 栈 就 会 加 一 层 栈 帧 ; 每 当 函 数 返 回 , 栈 就 会 减 一 层 栈 帧 。 
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由 于 栈 的 大 小 不 是 无 限 的 ， 因 此 递归 调用 的 次 数 过 多 会 导致 栈 溢出 。 可 以 试 试 fact(1000)， 执 
行 结果 如 下 : 
Traceback (most recent call last): 
File "D:/python/workspace/functiondef.py", line 271, in <module> 
print(' 调 用 递归 函数 执行 结果 为 : ',fact(1000)) 
File "D:/python/workspace/functiondef.py", line 269, in fact 
returnn * fact(n - 1) 
File "D:/python/workspace/functiondef.py", line 269, in fact 
returnn * fact(n - 1) 


il "D:/python/workspace/functiondef.py", line 267, in fact 
fn=—=l: 

RecursionError: maximum recursion depth exceeded in comparison 

由 执行 结果 看 到 ， 执 行 出 现 异常 ， 异 常 提示 超过 最 大 递归 深度 。 

这 个 问题 怎么 解决 呢 ? 

解决 递归 调用 栈 溢出 的 方法 是 通过 尾 递归 优化 ， 事 实 上 尾 递归 和 循环 的 效果 一 样 ， 把 循 
环 看 成 一 种 特殊 尾 递归 函数 也 可 以 。 

尾 递归 是 指 在 函数 返回 时 调用 函数 本 身 ， 并 且 return 语句 不 能 包含 表达 式 。 这 样 ， 编 译 器 
或 解释 器 就 可 以 对 尾 递归 进行 优化 ,使 递归 本 身 无 论调 用 多 少 次 都 只 占用 一 个 栈 帧 ， 从 而 避免 
栈 溢出 的 情况 。 

由 于 上 面 的 fact(n) 函 数 return n * fact(n - 1) 引 入 了 乘法 表达 式 ， 因 此 不 是 尾 递归 。 要 改 成 
尾 递归 方式 需要 多 一 点 代码 ， 主 要 是 把 每 一 步 乘 积 传 入 递归 函数 中 ， 看 如 下 函数 定义 方式 ; 

#! /usr/bin/python3 

#-*- coding:UTF-8 -*- 


def fact(n): 
return fact_iter(n, 1) 


def fact_iter(num, product): 
ifnum 一 1: 
return product 
return fact_iter(num - 1, num * product) 


可 以 看 到 ，return fact_iter(num - 1, num * producb 仅 返回 递归 函数 本 身 ，num - 1 和 num * 
product 在 函数 调用 前 就 会 被 计算 ， 不 影响 函数 调用 。 

fact(5) 对 应 的 fact_iter(5, 1) 的 调用 如 下 : 

= 一 > fact iter(5, 1) 

=—> fact iter(4, 5) 

=—> fact iter(3, 20) 
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=—> fact iter(2, 60) 
= 一 > fact iter(1, 120) 
= 一 > 120 


由 操作 结果 看 到 ， 调 用 尾 递归 时 如 果 做 了 优化 ， 栈 就 不 会 增长 ， 因 此 无 论 多 少 次 调用 都 
不 会 导致 栈 溢出 。 


7.11 匿名 函数 


什么 是 匿名 函数 呢 ? 

匿名 函数 就 是 不 再 使 用 def 语句 这 样 的 标准 形式 定义 一 个 函数 。 

Python 使 用 lambda 创建 匿名 函数 。 

lambda 只 是 一 个 表达 式 ， 函 数 体 比 def 简单 很 多 。 

lambda 的 主体 是 一 个 表达 式 ， 而 不 是 一 个 代码 块 ， 仅 能 在 lambda 表达 式 中 封装 有 限 的 逻 
辑 。lambda 函数 拥有 自己 的 命名 空间 ， 不 能 访问 自 有 参数 列表 之 外 或 全 局 命名 空间 的 参数 。 

lambda 函数 的 语法 只 包含 一 个 语句 ， 语 句 如 下 : 


lambda [argl [,arg2,.....argn]]:expression 


匿名 函数 应 该 如 何 应 用 呢 ? 
先 看 一 个 求 两 个 数 的 和 的 示例 。 
使 用 def 语句 : 


def func(x,y): 
return X+y 


使 用 lambda 表达 式 : 
lambda x,y: X+y 


由 上 面 的 代码 可 以 看 到 ， 使 用 lambda 表达 编写 的 代码 比 使 用 def 语句 少 。 这 里 不 太 明显 ， 
再 看 一 个 代码 更 多 的 示例 。 
比如 求 一 个 列表 中 大 于 3 的 元 素 。 
通过 过 程式 编程 实现 ， 也 是 常规 的 方法 。 在 交互 模式 下 输入 如 下 : 
>>>L1=[1,23,4,5] 
>>> L2=[ 
>>> foriin Ll: 
if i>3: 
L2.append(i) 


>>> print( 列 表 中 大 于 3 的 元 素 有 : ',L2) 
列表 中 大 于 3 的 元 素 有 : [4, 5] 
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通过 函数 式 编程 实现 ， 运 用 filter， 给 出 一 个 判断 条 件 : 


def func(x): 
return x>3 
flist=filter(func,[1,2,3,4,5]) 
print( 列 表 中 大 于 3 的 元 素 有 : ',[item for item in f list]) 


执行 结果 如 下 : 

列表 中 大 于 3 的 元 素 有 : [4, 5] 

如 果 运 用 匿名 函数 ， 就 会 更 加 精简 ， 一 行 代码 即 可 : 

print( 列表 中 大 于 3 的 元 素 有 : [item for item in filter(lambda x:x>3,[1,2,3,4,5])]) 
执行 结果 如 下 : 

列表 中 大 于 3 的 元 素 有 : [4, 5] 


从 上 面 的 操作 可 以 看 出 ，lambda 一 般 应 用 于 函数 式 编程 ， 代 码 简 洁 ， 常 和 filter 等 函数 结 
合 使 用 。 

我 们 对 上 面 使 用 lambda 的 示例 进行 解析 。 

在 表达 式 中 : 

x 为 lambda 函数 的 一 个 参数 。 

:为 分 割 符 。 

x>3 则 是 返回 值 ， 在 lambda 函数 中 不 能 有 return， 其 实 冒 号 (:) 后 面 就 是 返回 值 。 

item for item in filter 是 Python 3 中 filter 函数 的 取 值 方式 ， 因 为 从 Python 3 起 ，filter 函数 
返回 的 对 象 从 列表 改 为 友 代 器 (filter object) 。filter object 支持 迭代 操作 ， 比 如 for 循环 : 


for item in a_filter_object: 





print(item) 
如 果 还 是 需要 一 个 列表 ， 就 可 以 这 样 得 到 它 : 
filter_list = [item for item in a_filter_object] 


由 这 些 示例 可 以 看 到 ， 匿 名 函数 确实 有 它 的 优点 。 
这 里 有 一 个 疑问 ， 在 什么 情况 下 使 用 匿名 函数 呢 ? 

- 般 以 下 情况 多 考虑 使 用 匿名 函数 : 

(1) 程序 一 次 性 使 用 、 不 需要 定义 函数 名 时 ,用 匿名 函数 可 以 节省 内 存 中 变量 定义 空间 。 
(2) 如 果 想 让 程序 更 加 简洁 ， 使 用 匿名 函数 就 可 以 做 到 。 
当然 ， 匿 名 函数 有 3 个 规则 要 记 住 : 

(1) 一 般 有 一 行 表达 式 ， 必 须 有 返回 值 。 

(2) 不 能 有 return。 

(3) 可 以 没有 参数 ， 也 可 以 有 一 个 或 多 个 参数 。 
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下 面 看 几 个 匿名 函数 的 示例 〈 在 交互 模式 下 输入 ) 。 


无 参 匿名 函数 : 

>>>t=lambda : True# 分 号 前 无 任何 参数 
>>>t0 

True 

带 参 数 匿 名 函数 : 


>>> lambda x: x**3 # 一 个 参数 
>>> lambda x,yz:x+y+Z# 多 个 参数 
>>> lambda x,y=3: x*y# 人 允许 参数 存在 默认 值 


匿名 函数 调用 : 


>>> c= lambda X,y,Z: x*y*z 

>>> c(2,3,4) 

24 

>>> c=lambda x,y=2: x+y # 使 用 了 默认 值 
>>> c(10) # 如 果 不 输 入 ， 就 使 用 默认 值 2 
12 


7.12 偏 函数 


偏 函数 是 从 Python 2.5 引入 的 概念 ， 通 过 functools 模块 被 用 户 调用 。 注 意 这 里 的 偏 函数 


和 数学 意义 上 的 偏 函 数 不 一 样 。 


偏 函数 是 将 所 要 承载 的 函数 作为 partial0 函 数 的 第 一 个 参数 ， 原 函数 的 各 个 参数 依次 作为 


partial() 函 数 的 后 续 参 数 ， 除 非 使 用 关键 字 参 数 。 


里 ， 


通过 语言 描述 可 能 无 法 理解 偏 函数 怎么 使 用 ， 下 面 举 一 个 常见 的 例子 说 明 。 在 这 个 例子 
将 实现 一 个 取 余 函数 ， 取 得 整数 100 对 不 同 数 m 的 100%m 的 余数 。 编 写 代码 如 下 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


from functools import partial 


def mod( n, m ): 
return n % m 


mod_by_100= partial( mod, 100 ) 


print(' 自 定义 函数 ，100 对 7 取 余 结果 为 : ,mod( 100, 7 )) 
print(" 调 用 偏 函数 ，100 对 7 取 余 结果 为 : ',mod_by_100( 7)) 
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函数 执行 结果 为 : 

自 定义 函数 ，100 对 7 取 余 结果 为 : 2 

调用 偏 函 数 ，100 对 7 取 余 结 果 为 : 2 

由 执行 结果 看 到 ， 使 用 偏 函 数 所 需 代码 量 比 自 定义 函数 更 少 、 更 简洁 。 

在 介绍 函数 的 参数 时 ， 我 们 讲 到 通过 设 定 参数 的 默认 值 可 以 降低 函数 调用 的 难度 。 从 上 
面 的 示例 来 看 ， 偏 函数 也 可 以 做 到 这 一 点 。 


7.13 “牛刀 小 试 一 一 经 典 排序 之 快速 排序 实现 


快速 排序 (quick sort) 是 一 种 分 治 排序 算法 。 该 算法 首先 选取 一 个 划分 元 素 (partition 
element， 也 称 为 pivot) ; 然后 重 排列 表 ， 将 其 划分 为 3 部 分 ， 即 left (小 于 划分 元 素 pivot 的 
部 分 ) 、pivot (划分 元 素 ) 、right (大 于 划分 元 素 pivot 的 部 分 ) ， 此 时 划分 元 素 pivot 已 经 
在 列表 的 最 终 位 置 上 ; 最 后 分 别 对 left 和 right 两 部 分 进行 递归 排序 。 

其 中 ， 划 分 元 素 的 选取 直接 影响 快速 排序 算法 的 效率 ， 通 常 选择 列表 的 第 一 个 元 素 、 中 
间 元 素 或 最 后 一 个 元 素 作为 划分 元 素 , 当然 也 有 更 复杂 的 选择 方式 。 划 分 过 程 根据 划分 元 素 重 
排列 表 ， 是 快速 排序 算法 的 关键 所 在 。 

快速 排序 算法 的 优点 是 原 位 排序 (只 使 用 很 小 的 辅助 栈 ) ,平均 时 间 复 杂 度 为 Oo log n)。 
快速 排序 算法 的 缺点 是 不 稳定 ， 最 坏 情况 下 时 间 复 杂 度 为 O(n”)。 

代码 实现 如 下 : 

#! /usr/bin/python3 

#-*- coding:UTF-8 -*- 


def quicksort(L): 
qsort(L, 0, len(L)- 1) 


def qsort(L., first, last): 
if first < last: 
split = partition(L., first last) 
qsort(L., first, split - 1) 
qsort(L, split + 1, last) 


def partition(L, first, last): 
# 选取 列表 中 的 第 一 个 元 素 作 为 划分 元 素 
pivot = L[first] 
leftmark = first + 1 
rightmark = last 


while True: 


2 
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while L[leftmark] <= pivot: 
# 如 果 列 表 中 存在 与 划分 元 素 pivot 相等 的 元 素 ， 让 它 位 于 left 部 分 
# 以 下 检测 用 于 划分 元 素 pivot 是 列表 中 的 最 大 元 素 时 
# 防止 leftmark 越界 
if leftmark 一 rightmark: 
break 
leftmark += 1 
while LIrightmark] > pivot: 
# 这 里 不 需要 检测 ， 划 分 元 素 pivot 是 列表 中 的 最 小 元 素 时 
# rightmark 自动 停 在 first 处 
Tightmark -= 1 
if leftmark < rightmark: 
# 此 时 ，leftmark 处 的 元 素 大 于 pivot 
# rightmark 处 的 元 素 小 于 等 于 pivot， 交 换 两 者 
Llleftmark], LIrightmark] = L[rightmark], LIleftmark] 
else: 
break 
# 交换 first 处 的 划分 元 素 与 rightmark 处 的 元 素 
L[first], LIrightmark] = L[rightmark], L[first] 
# 返回 划分 元 素 pivot 的 最 终 位置 


return rightmark 
函数 调用 示例 : 


num list=[5, -4, 6, 3,7, 11, 1, 2] 
print( 排 序 之 前 :'+ str(num_list)) 
quicksorttnum _ list) 

print( 排 序 之 后 :'+ str(num_list)) 


执行 结果 如 下 : 
排序 之 前 : [5, -4, 6, 3, 7, 11, 1, 2] 
排序 之 后 : [-4, 1, 2, 3, 5, 6, 7, 11] 





7.14 调 试 


前 面 对 调 试 的 介绍 都 是 基于 刻意 犯错 进行 的 ， 本 章 开始 介绍 一 些 调试 技巧 。 
将 一 个 大 程序 分 解 为 小 函数 ， 自 然 引 入 了 调试 的 检查 点 。 如 果 一 个 函数 不 能 正常 工作 ， 
可 以 先 考虑 以 下 3 点 : 
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(1) 函数 获得 的 实 参 有 问题 ， 某 个 前 置 条 件 没有 达到 。 

(2) 函数 本 身 有 问题 ， 某 个 后 置 条 件 没 有 达到 。 

(3) 函数 的 返回 值 有 问题 或 使 用 方式 不 对 。 

要 检查 第 一 个 问题 ， 可 以 在 函数 体 开始 处 加 上 print 语句 ， 显 示 实 参 的 值 或 类 型 ， 用 于 显 
示 检 查 前 置 条 件 。 

如 果实 参 没有 问题 ， 就 在 每 个 retum 语句 前 添加 print 语句 ， 显 示 返 回 值 。 如 果 有 可 能 ， 
手动 检查 返回 值 ， 使 用 更 容易 检查 结果 的 参数 调用 函数 。 

如 果 函 数 没有 问题 ， 就 检查 调用 代码 ， 确 保函 数 返 回 值 被 正确 使 用 。 

使 用 中 要 学 会 充分 使 用 print 语句 ， 该 语句 能 帮 我 们 清晰 了 解 函数 的 执行 流程 。 





7.15 ”问题 解答 


(1) len()、count()、sum() 三 个 计算 函数 有 什么 区 别 ? 


答 : e len(0): 返回 对 象 的 长 度 。 比 如 len([1,2,3])， 返 回 值 为 3。 
e@ count(): 计算 包含 对 象 的 个 数 。 比 如 [1,1,1,2].count(1)， 返 回 值 为 3。 
e sum0: 做 一 个 和 运算 。 比 如 sum([1,2,3])， 返 回 值 为 6。 


(2) 函数 在 项 目 中 使 用 得 多 吗 ? 

答 : 函数 在 项 目 中 使 用 得 非常 多 。 在 项 目 实战 中 ， 为 了 方便 团队 开发 和 代码 复 用 ， 我 们 
所 写 的 所 有 程序 几乎 都 需要 以 函数 的 方式 定义 。 一 旦 定义 了 一 个 函数 ， 其 他 Python 文件 就 可 
以 通过 import 的 方式 从 文件 中 导入 这 个 函数 直接 使 用 ， 从 而 实现 代码 的 复 用 。 

(3) 如 何 灵活 使 用 函数 ? 

答 ， 函数 在 Python 中 是 一 个 很 重要 的 概念 ， 能 灵活 使 用 函数 对 我 们 帮助 很 大 。 要 灵活 使 
用 函数 ， 首 先 要 能 灵活 编写 语句 ， 函 数 是 语句 的 集合 ， 语 名 写 得 灵活 了 ， 函 数 也 就 灵活 了 。 语 
名 灵活 是 指 写 出 的 语句 所 表达 的 意思 清晰 , 不 但 单条 语句 意思 要 清晰 ,语句 之 间 的 关系 也 要 清 
晰 。 当 然 ， 需 要 实战 经 验 的 积累 和 方法 的 党 试 ， 才 能 这 渐 灵活 使 用 函数 。 


7.16 温 故 知 新 ， 学 以 致 用 


本 章 主要 讲解 了 函数 定义 、 函 数 参 数 、 变 量 作用 域 、 函 数 递 归 等 内 容 ， 在 本 章 结束 前 
顾 一 下 学 到 的 概念 。 

(1) 如 何 定义 函数 ? 

(2) 函数 有 哪些 参数 类 型 ? 

(3) 什么 是 形 参 和 实 参 ? 


加 





.174 。 
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(4) 变量 的 作用 域 有 哪些 ? 
(5) 怎么 使 用 递归 函数 ? 


尝试 思考 并 解决 如 下 问题 : 

1. 请 利用 Python 内 置 的 hex0) 函 数 把 一 个 整数 转换 成 十 六 进 制 表示 的 字符 串 。 

2. 请 定义 一 个 函数 quadratic(a, b, c)， 接 收 3 个 参数 ， 返 回 一 元 二 次 方程 ax2+ bx+c=0 
的 两 个 解 。 


(7 计算 平方 根 可 以 调用 math.sqrt() 函 数 。 
提 示 

3. 给 你 一 个 包含 不 同 英文 字母 和 标点 符号 的 文本 ， 找 到 其 中 出 现 最 多 的 字母 ， 返 回 的 字 
母 必须 是 小 写 形式 ， 检 查 字母 时 不 区 分 大 小 写 ， 如 在 搜索 中 "A" 一 "a"。 要 确保 不 计算 标点 符 
号 、 数 字 和 空格 ， 只 计算 字母 。 

如 果 找 到 两 个 或 两 个 以 上 具有 相同 频率 的 字母 ， 那 么 返回 先 出 现在 字母 表 中 的 字母 。 例 
如 ，one 包含 o、n、e 每 个 字母 一 次 ， 因 此 我 们 选择 e。 


. 175 。 





2 面向 对 象 编程 


前 几 章 介绍 了 Python 主要 的 内 建 对 象 类 型 (数字 、 字 
符 串 、 列 表 、 元 组 和 字典 ) 和 自 定义 函数 的 方式 。Python 
还 支持 创建 自己 的 对 象 。 

Python 从 设计 之 初 就 是 一 门面 向 对 象 语言 , 它 提供 一 些 
语言 特性 支持 面向 对 象 编程 。 

创建 对 象 是 Python 的 核心 概念 ， 本 章 将 介绍 如 何 创建 
对 象 ， 以 及 多 态 、 封 装 、 方 法 和 继承 等 概念 。 





A 
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8.1.1 


8.1 理解 面向 对 象 


什么 是 面向 对 象 编程 


Python 是 一 门面 向 对 象 编 程 语言 ， 对 面向 对 象 语言 编码 的 过 程 叫 作 面向 对 象 编程 。 

面向 对 象 编程 《Object Oriented Programming，OOP) 是 一 种 程序 设计 思想 。OOP 把 对 象 
作为 程序 的 基本 单元 ， 一 个 对 象 包含 数据 和 操作 数据 的 函数 。 

面向 对 象 程序 设计 把 计算 机 程序 视 为 一 组 对 象 的 集合 ， 每 个 对 象 都 可 以 接收 其 他 对 象 发 
过 来 的 消息 ， 并 处 理 这 些 消息 ， 计 算 机 程序 的 执行 就 是 一 系列 消息 在 各 个 对 象 之 间 传 递 。 

在 Python 中 ， 所 有 数据 类 型 都 被 视 为 对 象 ， 也 可 以 自 定义 对 象 。 自 定义 对 象 数 据 类 型 就 
是 面向 对 象 中 的 类 〈Class) 的 概念 。 


8.1.2 面向 对 象 术 语 简 介 


在 开始 具体 介绍 面向 对 象 技术 之 前 ， 我 们 先 了 解 一 些 面向 对 象 的 术语 ， 以 便 在 后 续 内 容 
中 碰 到 对 应 词 时 能 明白 这 些 术 语 的 意思 。 


类 : 用 来 描述 具有 相同 属性 和 方法 的 对 象 的 集合 。 类 定义 了 集合 中 每 个 对 象 共有 的 属 
性 和 方法 。 对 象 是 类 的 实例 。 

类 变量 (属性) : 类 变量 在 整个 实例 化 的 对 象 中 是 公用 的 。 类 变量 定义 在 类 中 ， 且 在 
方法 之 外 。 类 变量 通常 不 作为 实例 变量 使 用 。 类 变量 也 称 作 属性 。 


@ 数据 成 员 : 类 变量 或 实例 变量 用 于 处 理 类 及 其 实例 对 象 的 相关 数据 。 


方法 重 写 : 如 果 从 父 类 继承 的 方法 不 能 满足 子 类 的 需求 ， 就 可 以 对 其 进行 改写 ， 这 个 
过 程 称 为 方法 的 覆盖 (Override ) ， 也 称 为 方法 的 重 写 。 

实例 变量 : 定义 在 方法 中 的 变量 只 作用 于 当前 实例 的 类 。 

多 态 (Polymorphism ) : 对 不 同类 的 对 象 使 用 同样 的 操作 。 

封装 (Encapsulation ) : 对 外 部 世界 隐藏 对 象 的 工作 细节 。 

继承 ( Inheritance ) : 即 一 个 派生 类 (derived class ) 继承 基 类 (base class ) 的 字段 和 
方法 。 继 承 允 许 把 一 个 派生 类 的 对 象 作 为 一 个 基 类 对 象 对 待 ， 以 普通 类 为 基础 建立 专 
门 的 类 对 象 。 


e 实例 化 (Instance ) : 创建 一 个 类 的 实例 、 类 的 具体 对 象 。 
e 方法 : 类 中 定义 的 函数 。 
e 对 象 : 通过 类 定义 的 数据 结构 实例 。 对 象 包括 两 个 数据 成 员 ( 类 变量 和 实例 变量 ) 和 


方法 。 


和 其 他 编程 语言 相 比 ，Python 在 尽 可 能 不 增加 新 语法 和 语义 的 情况 下 加 入 了 类 机 制 。 

Python 中 的 类 提供 了 面向 对 象 编程 的 所 有 基本 功能 : 类 的 继承 机 制 允 许多 个 基 类 、 派 生 
类 可 以 覆盖 基 类 中 的 任何 方法 、 方 法 中 可 以 调用 基 类 中 的 同名 方法 。 

对 象 可 以 包含 任意 数量 和 类 型 的 数据 。 
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8.2 ”类 的 定义 与 使 用 


8.2.1 类 的 定义 


开始 介绍 前 先 看 一 个 类 的 示例 : 
class MyClass(object): 
i= 123 
def f(self): 
return 'hello world' 


由 上 面 的 代码 可 以 得 知 ， 类 定义 的 语法 格式 如 下 : 


class ClassName(object): 
<statement-1> 


<statement-N> 
由 代码 片段 和 类 定义 我 们 看 到 , Python 中 定义 类 使 用 class 关键 字 , class 后 面 紧 接着 类 名 ， 
如 示例 中 的 MyClass， 类 名 通常 是 大 写 开头 的 单词 : 紧 接 着 是 (object), 表示 该 类 是 从 哪个 类 继 
承 下 来 的 。 通 常 ， 如 果 没 有 合适 的 继承 类 ， 就 使 用 object 类 ， 这 是 所 有 类 最 终 都 会 继承 的 类 。 
类 包含 属性 (相当 于 函数 中 的 语句 ) 和 方法 (类 中 的 方法 大 体 可 以 理解 成 第 7 章 所 学 的 函数 ) 。 


在 类 中 定义 方法 的 形式 和 函数 差不多 ， 但 不 称 为 函数 ， 而 称 为 方法 。 方 法 的 调用 需要 绑 
往生。 定 到 特定 对 象 上 ， 而 函数 不 需要 。 我 们 后 面 会 逐步 接触 方法 的 调用 方式 。 
8.2.2 ”类 的 使 用 


本 节 简 单 讲述 类 的 使 用 。 以 8.2.1 小 节 的 示例 为 例 ( 别 忘 了 写 开头 两 行 )， 保 存 并 执行 ( 程 
序 编写 完成 后 ， 需 要 将 文件 保存 为 后 级 为 .py 的 文件 ， 在 cmd 命令 窗口 下 执行 .py 文件 ) : 


#! /usr/bin/python3 
#-*-coding:UTF-8-*- 


class MyClass(object): 
i=123 
def f(self): 
return 'hello world' 


los 
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Use_class = MyClass() 

print(' 调 用 类 的 属性 : ',use_classii) 

print(' 调 用 类 的 方法 : "use_classfO) 

执行 结果 如 下 : 

调用 类 的 属性 : 123 

调用 类 的 方法 : ”hello world 

由 输入 代码 中 的 调用 方式 可 知 ， 类 的 使 用 比 函 数 调用 多 了 几 个 操作 ， 调 用 类 时 需要 执行 
如 下 操作 : 

use_class = MyClass() 


这 步 叫 作 类 的 实例 化 ， 即 创建 一 个 类 的 实例 。 此 处 得 到 的 use_class 变量 称 为 类 的 具体 对 
象 。 再 看 后 面 两 行 的 调用 : 

print(' 调 用 类 的 属性 : ',use_class.i) 

print(' 调 用 类 的 方法 : ',use_class.f()) 

这 里 第 一 行 后 的 use_class.i 用 于 调用 类 的 属性 ， 也 就 是 我 们 前 面 所 说 的 类 变量 。 第 二 行 后 
的 use_class.f() 用 于 调用 类 的 方法 。 

在 上 面 的 示例 中 ， 在 类 中 定义 f0 方 法 时 带 了 一 个 self 参数 ， 该 参数 在 方法 中 并 没有 被 调 
用 ， 是 否 可 以 不 要 呢 ? 调用 名 方法 时 没有 传递 参数 ， 是 否 表示 参数 可 以 传递 也 可 以 不 传递 ? 

对 于 在 类 中 定义 方法 的 要 求 : 在 类 中 定义 方法 时 ， 第 一 个 参数 必须 是 self。 除 第 一 个 参数 
外 ， 类 的 方法 和 普通 函数 没什么 区 别 ， 如 可 以 用 默认 参数 、 可 变 参数 、 关 键 字 参 数 和 命名 关键 
字 参 数 等 。 

对 于 在 类 中 调用 方法 的 要 求 : 要 调用 一 个 方法 ， 在 实例 变量 上 直接 调用 即 可 。 除 了 self 
不 用 传递 ， 其 他 参数 正常 传 入 。 

类 对 象 支持 两 种 操作 ， 即 属性 引用 和 实例 化 。 属 性 引用 的 标准 语法 如 下 : 


obj.name 


语法 中 obj 代表 类 对 象 ，name 代表 属性 。 
8.3 深入 类 
我 们 在 前 面 简单 介绍 了 类 的 定义 和 使 用 ， 本 节 将 深入 介绍 类 的 相关 内 容 ， 如 类 的 构造 方 
法 和 访问 权限 。 
8.3.1 类 的 构造 方法 
在 开始 介绍 前 ， 我 们 对 前 面 的 示例 做 一 些 改动 ， 代 码 如 下 : 


.179 。 
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#! /usr/bin/python3 
# -*-coding:UTF-8-*- 


class MyClass(object): 
i=123 
def init (self, name): 
selfname = name 


def f(self): 
return 'hello,'+ selfname 


use_class = MyClass('xiaomeng') 
print(' 调 用 类 的 属性 : ',use_class.i) 
print(' 调 用 类 的 方法 : ',use_class.f()) 
程序 执行 结果 如 下 : 
调用 类 的 属性 : 123 
调用 类 的 方法 : ”hello,xiaomeng 


若 类 的 实例 化 语句 写法 和 之 前 一 样 ， 即 : 
use_class = MyClass() 
旦 序 执行 结果 如 下 : 
Traceback (most recent call last): 
File "D:/python/workspace/classdef.py", line 21, in <module> 


use_class = MyClass() 
TypeError: _ init_ () missing 1 required positional argument: name' 


从 代码 和 输出 结果 看 到 ， 实 例 化 MyClass 类 时 调用 了 _init_() 方 法 。 这 里 就 奇怪 了 ， 我 
们 在 代码 中 并 没有 指定 调用 _init_() 方 法 ， 怎 么 会 报 _init_() 方 法 错误 呢 ? 

在 Python 中 ，_init_0 方 法 是 一 个 特殊 方法 ， 在 对 象 实例 化 时 会 被 调用 。_init _0 的 意 
思 是 初始 化 ， 是 initialization 的 简写 。 这 个 方法 的 书写 方式 是 : 先 输入 两 个 下 划 线 ， 后 面 接着 
init， 再 接着 两 个 下 划 线 。 这 个 方法 也 叫 构造 方法 。 在 定义 类 时 , 若 不 显 式 地 定义 一 个 _init_() 
方法 ， 则 程序 默认 调用 一 个 无 参 的 _init_() 方 法 。 比 如 以 下 两 段 代 码 的 使 用 效果 是 一 样 的 : 


代码 一 : 


#! /usr/bin/python3 
#-*-coding:UTF-8-*- 


class Defaultmit(objecb: 
def _init (self): 
print( 类 实例 化 时 执行 我 ， 我 是 _init 方法 。') 
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def show(self): 
print (我 是 类 中 定义 的 方法 ， 需 要 通过 实例 化 对 象 调用 。) 

test = DefaultInit() 
print(' 类 实例 化 结束 。') 
test.show() 
程序 执行 结果 如 下 : 
类 实例 化 时 执行 我 ， 我 是 _init 方法 。 
类 实例 化 结束 。 
我 是 类 中 定义 的 方法 ， 需 要 通过 实例 化 对 象 调用 。 


代码 二 : 
#! /usr/bin/python3 
#-*-coding:UTF-8-*- 
class DefaultInit(object): 
def show(self): 
print (我 是 类 中 定义 的 方法 ， 需 要 通过 实例 化 对 象 调用 。) 
test = DefaultInit() 
Print(' 类 实例 化 结束 。') 
test.show() 
旦 序 执行 结果 如 下 : 
类 实例 化 结束 。 
我 是 类 中 定义 的 方法 ， 需 要 通过 实例 化 对 象 调用 。 
由 上 面 两 段 代 码 的 输出 结果 看 到 ， 当 代码 中 定义 了 __init_() 方 法 时 ， 实 例 化 类 时 会 调用 
该 方法 ， 若 没有 定义 _init_() 方 法 ， 实 例 化 类 时 也 不 会 报错 ， 此 时 调用 默认 的 _init_() 方 法 。 
在 Python 中 定义 类 时 若 没有 定义 构造 方法 (_init _() 方 法 ) ， 则 在 类 的 实例 化 时 系统 调 
用 默认 的 构造 方法 。 另 外 ，_init _() 方 法 可 以 有 参数 ,参数 通过 _init_() 传 递 到 类 的 实例 化 操 
作 上 。 
既然 _init _() 方 法 是 Python 中 的 构造 方法 ， 那 么 是 否 可 以 在 一 个 类 中 定义 多 个 构造 方法 
呢 ? 我 们 先 看 如 下 3 段 代 码 : 


代码 一 : 
#! /usr/bin/python3 
#-*-coding:UTF-8-*- 
class Defaultmit(objecb: 
def _init (self): 
print( 我 是 不 带 参数 的 _init 方法 。') 
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DefaultInitO 
print(' 类 实例 化 结束 。') 

程序 执行 结果 如 下 : 

我 是 不 带 参数 的 _init 方法 。 

类 实例 化 结束 。 

在 只 有 一 个 _init_() 方 法 时 ， 实 例 化 类 没有 什么 顾虑 。 
代码 二 : 


#! /usr/bin/python3 
# -*-coding:UTF-8-*- 


class DefaultInit(object): 
def _init (self): 
Print( 我 是 不 带 参 数 的 _init_ 方法。') 


def _init_ (self param): 
print( 我 是 带 一 个 参数 的 _init “方法 ， 参 数值 为 : "param) 


DefaultInit(hello’) 
print(' 类 实例 化 结束 。') 


呈 序 执行 结果 如 下 : 
我 是 带 一 个 参数 的 _init_ 方法， 参数 值 为 : hello 


类 实例 化 结束 。 

由 执行 结果 看 到 ,调用 的 是 带 了 一 个 param 参数 的 构造 方法 ， 若 把 类 的 实例 化 语句 更 改 为 : 
Defaultmit0) 

执行 结果 为 : 


Traceback (most recent call last): 
File "D:/python/workspace/classdef.py", line 59, in <module> 
DefaultInit() 
TypeError: _ init_() missing 1 required positional argument: ‘param' 
或 更 改 为 : 
DefaultInit('hello', ‘world'’) 
执行 结果 为 : 
Traceback (most recent call last): 
File "D:/python/workspace/classdef.py", line 61, in <module> 


DefaultInit('hello', 'world') 
TypeError: _ init_() takes 2 positional arguments but 3 were given 
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由 执行 结果 看 到 ， 实 例 化 类 时 只 能 调用 带 两 个 占 位 参数 的 构造 方法 ， 调 用 其 他 构造 方法 
都 会 报错 。 
代码 三 ; 
#! /usr/bin/python3 
# -*-coding:UTF-8-*- 
class DefaultInit(object): 
def init (self param): 
print( 我 是 带 一 个 参数 的 _init 方法 ， 参 数值 为 : "param) 
def _init (self): 
print( 我 是 不 带 参数 的 _init 方法 。') 
DefaultInit() 
print(' 类 实例 化 结束 。') 
程序 执行 结果 如 下 : 
我 是 不 带 参 数 的 _init 方法 。 
类 实例 化 结束 。 
由 执行 结果 看 到 ,调用 的 构造 方法 除了 self 外 ,没有 其 他 参数 。 若 把 类 的 实例 化 语句 更 改 
为 如 下 了 
Defaultmit(hello) 
执行 结果 为 : 
Traceback (most recent call last): 
File "D:/python/workspace/classdef.py", line 60, in <module> 
DefaultInit(hello) 
TypeError: _ init_() takes 1 positional argument but 2 were given 
或 更 改 为 : 
DefaultInit('hello', ‘world'’) 
执行 结果 为 : 
Traceback (most recent call last): 
File "D:/python/workspace/classdef.py", line 61, in <module> 
DefaultInit('hello', ‘world') 
TypeError: _ init_() takes 2 positional arguments but 3 were given 
由 执行 结果 看 到 ， 实 例 化 类 时 只 能 调用 带 一 个 占 位 参数 的 构造 方法 ， 调 用 其 他 构造 方法 
都 会 报错 。 
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由 以 上 几 个 示例 我 们 得 知 : 一 个 类 中 可 定义 多 个 构造 方法 ， 但 实例 化 类 时 只 实例 化 最 后 
的 构造 方法 , 即 后 面 的 构造 方法 会 覆盖 前 面 的 构造 方法 , 并 且 需 要 根据 最 后 一 个 构造 方法 的 形 
式 进行 实例 化 。 建 议 一 个 类 中 只 定义 一 个 构造 函数 。 


8.3.2 ”类 的 访问 权限 


在 类 内 部 有 属性 和 方法 ， 外 部 代码 可 以 通过 直接 调用 实例 变量 的 方法 操作 数据 ， 这 样 就 
隐藏 了 内 部 的 复杂 逻辑 ， 例 如 : 


#! /usr/bin/python3 
# -#-coding:UTF-8-*#- 


class Student(object): 
def init (self, name, score): 
selfname = name 
self.score = score 


def info(self): 
print( 学 生 : %s; 分 数 : %s' % (selfname, self.score)) 


stu= Student('xiaomeng',95) 
print (修改 前 分 数 :', stu.score) 
stu.info() 

stu.score=0 

print (修改 后 分 数 :', stu.score) 
stu.info() 


程序 执行 结果 如 下 : 
修改 前 分 数 : 95 
学 生 : xiaomeng; 分 数 : 95 


修改 后 分 数 : 0 
学 生 : xiaomeng; 分 数 : 0 


由 代码 和 输出 结果 看 到 ， 在 类 中 定义 的 非 构造 方法 可 以 调用 类 中 构造 方法 实例 变量 的 属 
性 ， 调 用 的 方式 为 self. 实 例 变 量 属性 名 ， 如 代码 中 的 selfname 和 selfscore。 可 以 在 类 的 外 部 
修改 类 的 内 部 属性 。 如 果 要 让 内 部 属性 不 被 外 部 访问 ， 该 怎么 办 呢 ? 

要 让 内 部 属性 不 被 外 部 访问 ， 可 以 在 属性 名 称 前 加 两 个 下 划 线 _。 在 Python 中 ， 实 例 的 
变量 名 如 果 以 _ 开 头 ， 就 会 变 成 私有 变量 (private) ， 只 有 内 部 可 以 访问 ， 外 部 不 能 访问 。 据 
此 ， 我 们 把 Student 类 改 一 改 : 

#! /usr/bin/python3 

#-*-coding:UTF-8-*- 
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class Student(object): 
def _ init (self, name, score): 
self_name= name 
self. score = score 


def info(self): 
print( 学 生 : %s; 分 数 : %s' % (self._name, self._score)) 


stu= Student('xiaomeng',95) 
print(' 修 改 前 分 数 : ', stu._score) 
stu.info() 


stu._score=0 


print(' 修 改 后 分 数 : ',stu._score) 
stu.info() 


程序 执行 结果 如 下 : 
Traceback (most recent call last): 
File "D:/python/workspace/classdef.py", line 81, in <module> 


print(" 修 改 前 分 数 :', stu._score) 
AttributeError: 'Student object has no attribute '_ score’ 


由 执行 结果 看 到 ， 我 们 已 经 无 法 从 外 部 访问 实例 变量 的 属性 _ score 了 。 这 样 有 什么 作用 
呢 ? 

这 样 可 以 确保 外 部 代码 不 能 随意 修改 对 象 内 部 的 状态 ， 通 过 访问 限制 的 保护 ， 代 码 更 加 
安全 。 比 如 上 面 的 分 数 对 象 是 一 个 比较 重要 的 内 部 对 象 ， 如果 外 部 可 以 随便 更 改 这 个 值 ， 大 家 
都 随便 更 改 自己 成 绩 表 单 中 的 分 数 ， 岂 不 是 很 混乱 。 

如 果 外 部 代码 要 获取 类 中 的 name 和 score 怎么 办 呢 ? 

在 Python 中 ， 可 以 为 类 增加 get_attrs 方法 ， 获 取 类 中 的 私有 变量 ， 例 如 在 上 面 的 示例 中 
添加 get_score (name 的 使 用 方式 类 同 ) 方法 ， 代 码 如 下 : 

#! /usr/bin/python3 

# -*-coding:UTF-8-*- 


class Student(object): 
def_ init_ (self, name, score): 
self._name= name 


self._ score = Score 


def info(self): 
print(' 学 生 : %s; 分 数 : %s' % (self._name, self._score)) 


def get_score(self): 
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return self._ score 


stu= Student('xiaomeng',95) 
print(' 修 改 前 分 数 : ,stu.get_score() 


stuiinfo() 

print(' 修 改 后 分 数 : ',stu.get_scoreO) 
stu.info() 

执行 结果 如 下 : 

修改 前 分 数 : 95 

学 生 : xiaomeng; 分 数 : 95 

修改 后 分 数 : 95 


学 生 : xiaomeng; 分 数 : 95 


由 执行 结果 看 到 ， 通 过 get_score 方法 已 经 可 以 正确 得 到 类 内 部 的 属性 值 。 

是 否 可 以 通过 外 部 更 改 内 部 私有 变量 的 值 呢 ? 

在 Python 中 ， 可 以 为 类 增加 set_attrs 方法 ， 修 改 类 中 的 私有 变量 ， 如 更 改 上 面 示例 中 的 
score 属性 值 ， 可 以 添加 set_score (name 使 用 方式 类 同 ) 方法 ， 代 码 如 下 : 


#! /usr/bin/python3 
#-*-coding:UTF-8-*- 


class Student(object): 
def init_ (self name, score): 
self._name= name 
self._ score = Score 


def info(self): 
print(' 学 生 : %s; 分 数 : %s' % (self_name, self._score)) 


def get_score(self): 
return self._ score 


def set_score(self, score): 


self._ score = Score 


stu= Student('xiaomeng',95) 
print(' 修 改 前 分 数 : ,stu.get_scoreO) 
stu.info() 

stu.set_score(0) 

print(' 修 改 后 分 数 : ',stu.get_score0) 
stu.info() 
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程序 执行 结果 如 下 : 

修改 前 分 数 : 95 

学 生 : xiaomeng; 分 数 : 95 

修改 后 分 数 : 0 

学 生 : xiaomeng; 分 数 : 0 

由 程序 执行 结果 看 到 , 通过 set_score 方法 正确 更 改 了 私有 变量 score 的 值 . 这 里 有 个 问题 ， 
原先 stu.score=0 这 种 方式 也 可 以 修改 score 变量 ,为 什么 要 费 这 么 大 周折 定义 私有 变量 ,还 定 
义 set_score 方法 呢 ? 

在 Python 中 , 通过 定义 私有 变量 和 对 应 的 set 方法 可 以 帮助 我 们 做 参数 检查 ,避免 传 入 无 
效 的 参数 ， 如 对 上 面 的 示例 更 改 如 下 : 

#! /usr/bin/python3 

# -*-coding:UTF-8-*- 











class Student(object): 
def _init (self, name, score): 
self._name = name 
self._ score = Score 


def info(self): 
print( 学 生 : %s; 分 数 : %s' % (self name, self._score)) 


def get_score(self): 
return self._ score 


if 0<=score<=100: 
self._ score = Score 


else: 


print(' 请 输入 0 到 100 的 数字 。') 


stu= Student('xiaomeng'.95) 
print(' 修 改 前 分 数 : ,stu.get_score()) 
stu.info() 

stu.set_score(-10) 

print(' 修 改 后 分 数 : ',stu.get_score0) 
stu.info() 


程序 执行 结果 如 下 : 


修改 前 分 数 : 95 
学 生 : xiaomeng; 分 数 : 95 
请 输入 0 到 100 的 数字 。 
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修改 后 分 数 : 95 
学 生 : xiaomeng; 分 数 : 95 


由 输出 结果 看 到 ， 调 用 set_score 方法 时 ， 如 果 传 入 的 参数 不 满足 条 件 ， 就 按照 不 满足 条 
件 的 程序 逻辑 执行 。 

既然 类 有 私有 变量 的 说 法 ， 那 么 类 是 否 有 私有 方法 呢 ? 

答案 是 肯定 的 ， 类 也 有 私有 方法 。 类 的 私有 方法 也 是 以 两 个 下 划 线 开头 ， 声 明 该 方法 为 
私有 方法 ， 且 不 能 在 类 外 使 用 。 私 有 方法 的 调用 方式 如 下 : 

self._ private_ methods 

我 们 通过 下 面 的 示例 进一步 了 解 私 有 方法 的 使 用 : 


#! /usr/bin/python3 
# -*-coding:UTF-8-*- 


class PrivatePublicMethod(object: 
def _init (self): 
pass 


def_ foo(self): # 私有 方法 
print( 这 是 私有 方法 ') 


def foo(self): # 公共 方法 
print( 这 是 公共 方法 ) 
print( 公 共 方 法 中 调用 私有 方法 ) 
self._ foo() 
print(' 公 共 方 法 调用 私有 方法 结束 ') 


pri_pub = PrivatePublicMethod|) 
print(' 开 始 调用 公共 方法 : ) 
pri_pub.foo0) 

print( 开 始 调用 私有 方法 : ) 
pri_pub._ foo() 

程序 执行 结果 如 下 : 

开始 调用 公共 方法 : 

这 是 公共 方法 

公共 方法 中 调用 私有 方法 

这 是 私有 方法 

公共 方法 调用 私有 方法 结束 
开始 调用 私有 方法 : 

Traceback (most recent call last): 
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File "D:/python/workspace/classdef.py", line 114, in <module> 
pri_pub. foo0 
AttributeError: 'PrivatePublicMethod' object has no attribute '_ foo' 


由 输出 结果 看 到 ， 私 有 方法 和 私有 变量 类 似 ， 不 能 通过 外 部 调用 。 
84 继 承 


面向 对 象 编程 带 来 的 好 处 之 一 是 代码 的 重用 ， 实 现 重 用 的 方法 之 一 是 通过 继承 机 制 。 继 
承 完全 可 以 理解 成 类 之 间 类 型 和 子 类 型 的 关系 。 
在 面向 对 象 程序 设计 中 ， 当 我 们 定义 一 个 class 时 ,可 以 从 某 个 现 有 的 class 继承 ,定义 的 
新 class 称 为 子 类 (Subclass), 而 被 继承 的 class 称 为 基 类 、 父 类 或 超 类 (Base class、 Super class)。 
继承 的 定义 如 下 : 
class DerivedClassName(BaseClassName): 
<statement-1> 





<statement-N> 


需要 注意 ， 继 承 语法 class 子 类 名 〈 基 类 名 ) 时 ，// 基 类 名 写 在 括号 里 ， 基 本 类 是 在 定义 
类 时 ， 在 元 组 中 指明 的 。 

在 Python 中， 继承 有 以 下 特点 : 

(1) 在 继承 中 ， 基 类 的 构造 方法 (_init 0 方法 ) 不 会 被 自动 调用 ， 需 要 在 子 类 的 构造 
方法 中 专门 调用 。 

(2) 在 调用 基 类 的 方法 时 需要 加 上 基 类 的 类 名 前 级 ， 并 带 上 self 参数 变量 。 区 别 于 在 类 
中 调用 普通 函数 时 不 需要 带 self 参数 。 

(3) 在 Python 中 ， 首 先 查找 对 应 类 型 的 方法 ， 如 果 在 子 类 中 找 不 到 对 应 的 方法 ， 才 到 类 
类 中 逐个 查找 。 


例如 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


class Animal(object): 
def run(self): 
Print(Animal is running...') 
上 面 定义 了 一 个 名 为 Animal 的 类 ， 类 中 定义 了 一 个 run() 方 法 直接 输出 〈 没 有 显 式 定义 
_ init_() 方 法 ， 会 调用 默认 的 构造 方法 ) 。 在 编写 Dog 和 Cat 类 时 ， 可 以 直接 从 Animal 类 继 
承 ， 定 义 如 下 : 


“189 ， 





Python 3.5 从 零 开始 学 





class Dog(Animal): 
pass 


class Cat(Animal): 
pass 
在 这 段 代码 片段 中 ， 对 于 Dog 来 说 ，Animal 就 是 它 的 父 类 ; 对 于 Animal 来 说 ，Dog 就 是 
它 的 子 类 。Cat 和 Dog 类 似 。 


继承 有 什么 好 处 ? 

继承 最 大 的 好 处 是 子 类 获得 了 父 类 全 部 非 私 有 的 功能 。 由 于 在 Animial 中 定义 了 非 私 有 的 
run() 方 法 , 因此 作为 Animial 的 子 类 ,Dog 和 Cat 什么 方法 都 没有 定义 , 自动 拥有 父 类 中 的 run0) 
方法 。 

执行 以 上 代码 : 

dog= Dog() 

dog.run() 














cat= Cat() 

cat.run() 

程序 执行 结果 如 下 : 
Animal is running... 
Animal is running... 


由 执行 结果 看 到 ， 子 类 中 没有 定义 任何 方法 ， 但 都 成 功 执行 了 run() 方 法 。 
当然 ， 子 类 可 以 拥有 一 些 自己 的 方法 ， 比 如 在 Dog 类 中 增加 一 个 eat 方法 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


class Dog(Animal): 
def eat(self): 
print(Eating ...') 


dog= Dog() 
dog.run() 
dog.eat() 


以 上 代码 执行 结果 如 下 : 


Animal is running... 


Eating ... 


由 执行 结果 看 到 ， 既 执行 了 父 类 的 方法 ， 又 执行 了 自己 定义 的 方法 。 
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子 类 不 能 继承 父 类 中 的 私有 方法 ， 也 不 能 调用 父 类 的 私有 方法 。 父 类 的 定义 如 下 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


class Animal(object): 
def run(self): 
Print(Animal is running.…) 


def _run(self): 
print(I am a private method.) 
子 类 定义 不 变 ， 执 行 如 下 调用 语句 : 
dog= Dog() 
dog._run() 
执行 结果 如 下 : 
Traceback (most recent call last): 
File "D:/python/workspace/classextend.py", line 25, in <module> 
dog._run() 
AttributeError: 'Dog' object has no attribute '_run' 
由 执行 结果 看 到 ， 子 类 不 能 调用 父 类 的 私有 方法 ， 子 类 虽然 继承 了 父 类 ， 但 是 调用 父 类 
的 私有 方法 相当 于 从 外 部 调用 类 中 的 方法 ， 因 而 调用 不 成 功 。 
对 于 父 类 中 扩展 的 非 私有 方法 ， 子 类 可 以 拿 来 即 用 ， 如 在 父 类 Animal 中 增加 一 个 jump 
方 法 : 
class Animal(object): 
def run(self): 
Print(Animal is running.…) 


def jump(self): 
Print(Animal is jumpping....') 


def _ run(self): 
Print(T am a private method.) 


上 面 我 们 增加 了 一 个 非 私有 的 jump0 方 法 ， 子 类 Dog 和 Cat 保持 原样 ， 执 行 如 下 调用 : 


dog= Dog) 
dog.run() 
dogjump() 


cat= Cat() 
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catrun() 

catjump() 

执行 结果 如 下 : 

Animal is running... 

Animal is jumpping.... 

Animal is running... 

Animal is jumpping.… 

由 执行 结果 看 到 ， 子 类 可 以 立即 获取 父 类 增加 的 非 私 有 方法 。 

继承 可 以 一 级 一 级 继承 下 来 ， 就 好 比 从 爷爷 到 爸爸 再 到 儿子 的 关系 。 所 有 类 最 终 都 可 以 
追溯 到 根 类 object， 这 些 继承 关系 看 上 去 就 像 一 颗 倒 着 的 树 ， 如 图 8-1 所 示 。 


Ze 


[ pog ) (cat ) (Tee ) ( Fower ) 


图 8-1 继承 树 








8.5 多 态 


我 们 在 8.4 节 讲 述 了 继承 ,继承 可 以 帮助 我 们 重复 使 用 代码 。 但 对 于 继承 中 的 示例 ， 无 论 
是 Dog 还 是 Cat， 调 用 父 类 的 run() 方 法 时 显示 的 都 是 Animal is running...， 如 果 想 让 结果 显示 
为 Dog is running... 和 Cat is running.…， 该 怎么 处 理 呢 ? 

我 们 对 Dog 和 Cat 类 做 如 下 改进 : 

#1 /usr/bin/python3 

# -*- coding:UTF-8 -*- 


class Dog(AnimaD): 
def run(self): 


Print(Dog is running...') 


class Cat(Animal): 


2 
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def run(self): 
Print('Cat is running...') 
执行 如 下 语句 : 
dog= Dog() 
print( 实 例 化 Dog 类 ) 
dog.run() 


cat= Cat() 
print( 实 例 化 Cat 类 ') 
cat.run() 

执行 结果 如 下 : 
实例 化 Dog 类 

Dog is running... 
实例 化 Cat 类 


Cat is running... 


由 执行 结果 看 到 ， 分 别 得 到 了 Dog 和 Cat 各 自 的 running 结果 。 

当 子 类 和 父 类 存在 相同 的 run() 方 法 时 ， 子 类 的 run() 方 法 会 覆盖 父 类 的 run() 方 法 , 在 代码 
运行 时 总 是 会 调用 子 类 的 run() 方 法 ， 称 之 为 多 态 。 

多 态 来 自 于 希腊 语 ， 意 思 是 有 多 种 形式 。 多 态 意 味 着 即使 不 知道 变量 所 引用 的 对 象 类 型 
是 什么 ， 也 能 对 对 象 进行 操作 ， 多 态 会 根据 对 象 〈 或 类 ) 的 不 同 而 表现 出 不 同 的 行为 。 例 如 ， 
我 们 在 上 面 的 Animal 类 中 定义 了 run 方法 ，Dog 和 Cat 类 分 别 继承 Animal 类 ， 并 且 分 别 定义 
了 自己 的 run 方法 ， 最 后 Dog 和 Cat 调用 的 是 自己 定义 的 run 方法 。 

为 了 更 好 地 理解 什么 是 多 态 ， 我 们 对 数据 类 型 再 做 一 点 说 明 。 当 我 们 定义 一 个 类 时 ， 实 
际 上 就 定义 了 一 种 数据 类 型 。 定 义 的 数据 类 型 和 Python 自 带 的 数据 类 型 (如 str、list、dict) 
没什么 两 样 。 

a 二 list()#a 是 list 类 型 

b=Animal()#b 是 Animal 类 型 

c=Dog0#c 是 Dog 类 型 


下 面 用 isinstance() 方 法 判断 一 个 变量 是 否 是 某 个 类 型 。 
print('a 是 否 为 list 类 型 : 'isinstance(a, list)) 

print('b 是 否 为 Animal 类 型 : ',isinstance(b, Animal)) 

print('c 是 否 为 Dog 类 型 :isinstance(c, Dog)) 

执行 结果 如 下 : 

a 是 否 为 list 类型: Tme 


b 是 否 为 Animal 类 型 : True 
c 是 否 为 Dog 类 型 : True 
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由 执行 结果 看 到 ，a、b、c 确实 分 别 为 list、Animal、Dog 三 种 类 型 。 我 们 再 执行 如 下 语句 : 
print('c 是 否 为 Dog 类 型 : ,isinstance(c, Dog)) 

print(e 是 否 为 Animal 类 型 : "isinstance(c, Animal)) 

执行 结果 如 下 : 

c 是 否 为 Dog 类 型 : True 

c 是 否 为 Animal 类 型 : True 


由 执行 结果 看 到 ，c 既是 Dog 类 型 又 是 Animal 类 型 。 这 怎么 理解 呢 ? 

因为 Dog 是 从 Animal 继承 下 来 的 ， 当 我 们 创建 Dog 的 实例 c 时 , 我 们 认为 c 的 数据 类 型 
是 Dog, 但 c 同时 也 是 Animal，Dog 本 来 就 是 Animal 的 一 种 。 

在 继承 关系 中 ， 如 果 一 个 实例 的 数据 类 型 是 某 个 子 类 ， 那 它 的 数据 类 型 也 可 以 看 作 是 父 
类 。 但 是 反 过 来 就 不 行 ， 例 如 以 下 语句 : 

b =Animal() 

print('b 是 否 为 Dog 类 型 : "isinstance(b, Dog)) 

执行 结果 如 下 : 

b 是 否 为 Dog 类 型 : False 

由 输出 结果 看 到 ， 变 量 b 是 Animal 的 实例 化 对 象 ， 是 Animal 类 型 ， 但 不 是 Dog 类 型 ， 
也 就 是 Dog 可 以 看 成 Animal， 但 Animal 不 可 以 看 成 Dog。 

我 们 再 看 一 个 示例 。 编 写 一 个 函数 ， 这 个 函数 接收 一 个 Animal 类 型 的 变量 ， 定 义 并 执行 
如 下 函数 ， 执 行 时 传 入 Animal 的 实例 : 

#! /usr/bin/python3 

#-*- coding:UTF-8 -*- 


def run_two_times(animal): 
animal.run() 
animal.run() 

run_two_times(Animal()) 

执行 结果 如 下 : 

Animal is running... 

Animal is running... 


若 执行 函数 时 传 入 Dog 的 实例 ， 操 作 如 下 : 
run_two_times(Dog()) 
得 到 执行 结果 如 下 : 
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Dog is running... 
Dog is running... 


若 传 入 Cat 的 实例 ， 操 作 如 下 : 
run_two_times(CatO) 
得 到 执行 结果 如 下 : 


Cat is running... 
Cat is running... 


看 上 去 没有 什么 特殊 的 地 方 ， 已 经 正确 输出 预期 结果 了 ， 但 是 仔细 想 想 ， 如 果 再 定义 一 
个 Bird 类 型 ， 也 继承 Animal 类 ， 定 义 如 下 : 

#! /usr/bin/python3 

#-*- coding:UTF-8 -*- 


class Bird(Animal): 
def run(self): 
print(Bird is flying the sky...') 
run_two_times(Bird()) 
旦 序 执行 结果 如 下 : 
Bird is flying the sky... 
Bird is flying the sky... 


由 执行 结果 我 们 发 现 ， 新 增 的 Animal 子 类 不 必 对 run_two_times() 方 法 做 任何 修改 。 实 际 
任何 依赖 Animal 作为 参数 的 函数 或 方法 都 可 以 不 加 修改 地 正常 运行 ， 原因 就 在 于 多 态 。 
多 态 的 好 处 是 : 当 我 们 需要 传 入 Dog、Cat、Bird 等 对 象 时 ， 只 需要 接收 Animal 类 型 就 可 
以 了 , 因为 Dog 、Cat、Bird 等 都 是 Animal 类 型 , 按照 Animal 类 型 进行 操作 即 可 。 由 于 Animal 
类 型 有 run() 方 法 ， 因 此 传 入 的 类 型 只 要 是 Animal 类 或 继承 自 Animal 类 ， 都 会 自动 调用 实际 
类 型 的 run() 方 法 。 

多 态 的 意思 是 : 对 于 一 个 变量 ， 我 们 只 需要 知道 它 是 Animal 类 型 ， 无 须 确切 知道 它 的 子 
类 型 ， 就 可 以 放心 调用 run() 方 法 。 具 体 调用 的 run() 方 法 作用 于 Animal、Dog、Cat 或 Bird 对 
象 ， 由 运行 时 该 对 象 的 确切 类 型 决定 。 

多 态 真正 的 威力 在 于 : 调用 方 只 管 调 用 ， 不 管 细节 。 当 我 们 新 增 一 种 Animal 的 子 类 时 ， 
只 要 确保 run0 方 法 编写 正确 即 可 ， 不 用 管 原来 的 代码 是 如 何 调用 的 。 这 就 是 著名 的 “ 开 闭 ” 
原则 : 对 于 扩展 开放 ， 人 允许 新 增 Animal 子 类 ; 对 于 修改 封闭 ,不 需要 修改 依赖 Animal 类 型 的 
run_two_times() 等 函数 。 

很 多 函数 和 运算 符 都 是 多 态 的 ， 你 写 的 绝 大 多 数 程序 也 可 能 是 ， 即 便 你 并 非 有 意 这 样 。 
只 要 使 用 多 态 函 数 和 运算 符 , 多 态 就 会 消除 .唯一 能 够 毁 掉 多 态 的 是 使 用 函数 显 式 地 检查 类 型 ， 
如 type、isinstance 函数 等 。 如 果 有 可 能 ， 就 尽量 避免 使 用 这 些 筑 掉 多 态 的 方式 ， 重 要 的 是 如 
何 让 对 象 按照 我 们 希望 的 方式 工作 ， 无 论 它 是 否 是 正确 类 型 或 类 。 


上 
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8.6 封 装 


前 面 两 节 我 们 讲述 了 Python 对 象 中 两 个 重点 一 一 继承 和 多 态 ， 本 节 将 讲述 第 3 个 重点 一 一 
封装 。 

封装 是 全 局 作用 域 中 其 他 区 域 隐藏 多 余 信 息 的 原则 。 听 起 来 有 些 像 多 态 ， 使 用 对 象 而 不 
用 知道 其 内 部 细节 。 它 们 都 是 抽象 原则 ， 都 会 帮忙 处 理 程 序 组 件 而 不 用 过 多 关心 细节 ， 就 像 函 

封装 并 不 等 同 于 多 态 。 多 态 可 以 让 用 户 对 不 知道 类 (或 对 象 类 型 ) 的 对 象 进行 方 法 调用 ， 
而 封装 可 以 不 用 关心 对 象 是 如 何 构建 的 ， 直 接 使 用 即 可 。 

前 面 几 节 的 示例 基本 都 用 到 封装 的 思想 ， 如 前 面 定义 的 Student 类 中 ， 每 个 实例 都 拥有 各 
自 的 name 和 score 数据 。 我 们 可 以 通过 函数 访问 这 些 数据 ， 如 输出 学 生 的 成 绩 ， 可 以 如 下 定 
义 并 执行 : 

#! /usr/bin/python3 

# -*- coding:UTF-8 -*- 


class Student(object): 
def _init (self, name, score): 
selfname = name 


self.score = score 


std = Student('xiaozhi',90) 
def info(std): 

print( 学 生 : %s; 分 数 : %s' % (std.name, std.score)) 
info(std) 


执行 结果 为 : 

学 生 : xiaozhi; 分 数 : 90 

由 输出 结果 看 到 ， 可 以 通过 函数 调用 类 并 得 到 结果 。 

既然 Student 实例 本 身 就 拥有 这 些 数据 ， 要 访问 这 些 数据 就 没有 必要 从 外 面 的 函数 访问 ， 
可 以 直接 在 Student 类 内 部 定义 访问 数据 的 函数 ， 这 样 就 把 “数据 ”封装 起 来 了 。 这 些 封装 数 
据 的 函数 和 Student 类 本 身 是 相关 联 的 , 我 们 称 之 为 类 的 方法 。 于 是 就 有 了 前 面 所 写 类 的 形式 : 

#! /usr/bin/python3 

# -*- coding:UTF-8 -*- 


class Student0(object): 
def _ init (self, name, score): 


selfname = name 
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Selfscore = Score 


def info(self): 
print( 学 生 : %s; 分 数 : %s' % (selfname, self.score)) 
要 定义 一 个 方法 , 除了 第 一 个 参数 是 self 外 , 其 他 参数 和 普通 函数 一 样 。 要 调用 一 个 方法 ， 
在 实例 变量 上 直接 调用 即 可 。 除 了 self 不 用 传递 ， 其 他 参数 正常 传 入 ， 执 行 如 下 语句 : 


stu= Student0(xiaomeng',95) 
执行 结果 为 : 
学 生 : xiaomeng; 分 数 : 95 


这 样 一 来 ， 我 们 从 外 部 看 Student 类 ， 只 需要 知道 创建 实例 需要 给 出 的 name 和 score， 如 
何 输出 是 在 Student 类 的 内 部 定义 的 ， 这 些 数 据 和 逻辑 被 “封装 ”起 来 了 ， 调 用 很 容易 ， 但 却 
不 用 知道 内 部 实现 的 细节 。 

封装 的 另 一 个 好 处 是 可 以 给 Student 类 增加 新 方法 ， 比 如 我 们 在 类 的 访问 权限 中 所 讲述 的 
get_score() 方 法 和 set_score() 方 法 。 使 用 这 些 方法 时 ， 我 们 无 须知 道内 部 实现 细节 ， 直 接 调 用 
即 可 。 


8.7 多重 继承 


8.6 节 讲 述 的 是 单 继 承 ，Python 还 支持 多 重 继承 。 多 重 继承 的 类 定义 如 下 : 


class DerivedClassName(Basel, Base2, Base3): 
<statement-1> 


<statement-N> 


可 以 看 到 ， 多 重 继 承 就 是 有 多 个 基 类 〈 父 类 或 超 类 ) 。 

需要 注意 圆 括号 中 父 类 的 顺序 ， 若 父 类 中 有 相同 的 方法 名 ， 在 子 类 使 用 时 未 指定 ，Python 
会 从 左 到 右 搜索 。 若 方法 在 子 类 中 未 找到 ， 则 从 左 到 右 查 找 父 类 中 是 否 包含 方法 。 

继续 以 前 面 的 Animal 类 为 例 ， 假 设 要 实现 4 种 动物 : Dog ( 狗 ) 、Bat (蝙蝠 ) 、Parrot 
( 鹦 赵 ) 、Ostrich (能 鸟 ) 。 

如 果 按 照 哺 乳 动物 和 鸟 类 分 类 ,我 们 可 以 设计 按 哺 乳 动 物 分 类 的 类 层次 图 , 如 图 8-2 所 示 。 
如 果 按 照 “ 能 跑 ” 和 “能 飞 ” 分 类 , 我 们 可 以 设计 按 行 为 功能 分 类 的 类 层次 图 ， 如 图 8-3 所 示 。 

如 果 要 把 上 面 的 两 种 分 类 都 包含 进来 ， 就 得 设计 更 多 层次 : 

哺乳 类 : 包括 能 跑 的 哺乳 类 和 能 飞 的 哺乳 类 。 

鸟 类 : 包括 能 跑 的 鸟 类 和 能 飞 的 鸟 类 。 
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Dog Bat Parrot Ostrich Dog Ostrich Parrot Bat 


图 8-2 按 哺乳 动物 分 类 的 类 层次 图 图 8-3 ” 按 行 为 功能 分 类 的 类 层次 图 
这 么 一 来 ， 类 的 层次 就 复杂 了 。 图 8-4 所 示 为 更 复杂 的 类 层次 图 。 


Animal 


ZN 
Mammal Bird 


有 


! | ! 


Dog Bat Ostrich Parrot 


8-4 更 复杂 的 类 层次 图 


如 果 还 要 增加 “宠物 类 ”和 “ 非 宠物 类 ”， 类 的 数量 就 会 呈 指 数 增长 ， 很 明显 这 样 设计 
是 不 行 的 。 
正确 的 做 法 是 采用 多 重 继承 。 首 先 ， 主 要 的 类 层次 仍 按照 哺乳 类 和 鸟 类 设计 ， 设 计 代码 
如 下 : 

#! /usr/bin/python3 

#-*- coding:UTF-8 -*- 
































class Animal(object): 
pass 

# 大 类 : 

class Mammal(Animal): 
pass 

class Bird(Animal): 


pass 


# 各 种 动物 : 
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class Dog(Mammal): 
pass 


class Bat(Mammal): 
pass 


class Parrot(Bird): 


pass 


class Ostrich(Bird): 
pass 


接 下 来 ， 给 动物 加 上 Runnable 和 Flyable 功能 。 我 们 先 定义 好 Runnable 和 Flyable 类 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


class Runnable(object): 
def run(self): 
print(Running...') 


class Flyable(object): 
def fly(self): 
print('Flying...') 


大 类 定义 好 后 ， 对 需要 Runnable 功能 的 动物 添加 对 Runnable 的 继承 ， 如 Dog: 


class Dog(Mammal, Runnable): 

pass 
对 需要 Flyable 功能 的 动物 添加 对 Flyable 的 继承 ， 如 Bat: 
class Bat(Mammal, Flyable): 

pass 


这 样 ， 通 过 上 面 的 多 重 继承 ， 一 个 子 类 就 可 以 继承 多 个 父 类 ， 同 时 获得 多 个 父 类 所 有 非 
私有 功能 。 


8.8 获取 对 象 信息 


当 我 们 调用 方法 时 可 能 需要 传递 一 个 参数 ， 这 个 参数 类 型 我 们 知道 ， 但 是 对 于 接收 参数 
的 方法 ， 就 不 一 定 知道 是 什么 参数 类 型 了 。 我 们 该 怎么 得 知 参数 的 类 型 呢 ? 
Python 为 我 们 提供 了 以 下 3 种 获取 对 象 类 型 的 方法 。 
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1. 使 用 type() 函 数 
我 们 前 面 已 经 学 习 过 type() 函 数 的 使 用 ， 基 本 类 型 都 可 以 用 type0 判 断 ， 例 如 : 
>>> type(123) 


<class 'int> 
>>> type(abc) 
<class str> 


>>> type(None) 
<class 'NoneType> 


如 果 一 个 变量 指向 函数 或 类 ， 用 type() 函 数 返 回 的 是 什么 类 型 ? 在 交互 模式 下 输入 : 
>>> type(abs) 
<class 'builtin function or_method> 


>>> type(pri_pub) ”# 上 一 节 定 义 的 PrivatePublicMethod 类 
<class' main .PrivatePublicMethod'> 


由 输出 结果 看 到 ， 返 回 的 是 对 应 的 Class 类 型 。 

如 果 我 们 要 在 让 语句 中 判断 并 比较 两 个 变量 的 type 类 型 是 否 相 同 ， 应 如 下 操作 : 
>>> type(123)==type(456) 

True 


>>> type(123) 一 int 
True 


>>> ypeabe) 一 type('123) 


True 

>>> type(abc) 一 str 

True 

>>> type(abec) 一 type(123) 

False 

通过 操作 我 们 看 到 ， 判 断 基本 数据 类 型 可 以 直接 写 int、str 等 。 怎 么 判断 一 个 对 象 是 否 是 
函数 呢 ? 

可 以 使 用 types 模块 中 定义 的 常量 ， 在 交互 模式 下 输入 : 

>>> import types 

>>> def func0: 

pass 





>>> type(fn)==types.FunctionType 

True 

>>> type(abs)==types.BuiltinFunctionType 
True 

>>> type(lambda x: x}==types.LambdaType 
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True 

>>> type((x for x in range(10))) 一 types.GeneratorType 

True 

由 执行 结果 看 到 ， 函 数 的 判断 方式 需要 借助 types 模块 的 帮助 。 
2. 使 用 isinstance() 函 数 


要 明确 class 的 继承 关系 , 使 用 type() 很 不 方便 , 通过 判断 class 的 数据 类 型 确定 class 的 继 
承 关系 要 方便 得 多 ， 这 个 时 候 可 以 使 用 isinstance() 函 数 。 

例如 ， 继 承 关 系 是 如 下 形式 : 

object -> Animal -> Dog 


即 Animal 继承 object、Dog 继承 Animal。 使 用 isinstance() 可 以 告诉 我 们 一 个 对 象 是 否 是 
某 种 类 型 。 

例如 ， 创 建 如 下 两 种 类 型 的 对 象 : 

>>> animal = Animal() 

>>> dog = Dog0 

对 上 面 两 种 类 型 的 对 象 ， 使 用 isinstance 进行 判断 : 

>>> isinstance(dog, Dog) 

True 

根据 输出 结果 看 到 ，dog 是 Dog 类 型 ， 这 个 没有 任何 疑问 ， 因 为 dog 变量 指向 的 就 是 Dog 
对 象 。 接 下 来 判断 Animal 类 型 ， 使 用 isinstance 判断 如 下 : 

>>> isinstance(dog, Animal) 

True 

根据 输出 结果 看 到 ，dog 也 是 Animal 类 型 。 

由 此 我 们 得 知 : 尽管 dog 是 Dog 类 型 ， 不 过 由 于 Dog 是 从 Animal 继承 下 来 的 ， 因 此 dog 
也 是 Animal 类 型 。 换 名 话说 ，isinstanceO) 判 断 的 是 一 个 对 象 是 否 为 该 类 型 本 身 ， 或 者 是 否 为 
该 类 型 继承 类 的 类 型 。 

我 们 可 以 确信 ，dog 还 是 object 类 型 : 

>>> isinstance(dog, object) 

True 

同时 确信 ， 实 际 类 型 是 Dog 类 型 的 dog， 同 时 也 是 Animal 类 型 : 

>>> isinstance(dog, Dog) and isinstance(dog, Animal) 

True 

不 过 animal 不 是 Dog 类 型 ， 这 个 我 们 在 8.5 节 已 经 讲述 过 : 

>>> isinstance(animal,Dog ) 

False 
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提醒 一 点 , 能 用 type0) 判 断 的 基本 类 型 也 可 以 用 isinstance() 判 断 。 这 个 可 以 自己 进行 验证 。 

isinstance() 可 以 判断 一 个 变量 是 否 为 某 些 类 型 中 的 一 种 , 判断 变量 是 否 为 list 或 tuple 的 方 
式 如 下 : 

ET 

True 

>>> isinstance((1, 2, 3), (list, tuple)) 

True 


3. 使 用 dir() 


如 果 要 获得 一 个 对 象 的 所 有 属性 和 方法 , 就 可 以 使 用 dir0) 函 数 。dir0 函 数 返 回 一 个 字符 串 
的 list。 例 如 ， 获 得 一 个 str 对 象 的 所 有 属性 和 方法 的 方式 如 下 : 


>>> dir(abc') 
Bead olass 2 comaine ss! delattt YY di dno Se eq YY Mem ge 

















J sentinbute "gettem 0 Seewag ,nt hah J Wi lor le lon 





Md DW Te ,Todo or Wp “mode 





'_ rmul ',' setattr ',' sizeof ',' str_',' subclasshook ','capitalize', 'casefold', 'center', 'count','encode', 
'endswith', 'expandtabs', 'find', format', 'format_map', "index', 'isalnum', 'isalpha', 'isdecimal', 'isdigit’, "isidentifier , 





"islower, 'isnumeric'’, 'isprintable', "isspace’, 'istitle', "isupper, join', "ljust', ‘lower', 'lstrip', maketrans', 'partition', 
‘replace’, 'rfind', rindex', ‘rjust', 'rpartition', 'rsplit’, 'rstrip'’, 'split', 'splitlines', 'startswith', 'strip', 'swapcase,’, ‘title', 
‘translate', 'upper’, 'zfill] 


由 输出 结果 看 到 ，str 对 象 包含 许多 属性 和 方法 。 
8.9 类 的 专 有 方法 


我 们 前 面 讲 述 了 类 的 访问 权限 、 私 有 变量 和 私有 方法 ， 除 了 自 定义 私有 变量 和 方法 外 ， 
Python 类 还 可 以 定义 专 有 方法 。 专 有 方法 是 在 特殊 情况 下 或 使 用 特别 语法 时 由 Python 调用 的 ， 
而 不 是 像 普 通 方法 一 样 在 代码 中 直接 调用 。 本 节 讲 述 几 个 Python 常用 的 专 有 方法 。 

看 到 形 如 _xxx_ 的 变量 或 函数 名 就 要 注意 ， 这 在 Python 中 是 有 特殊 用 途 的 。 

__init_ 我们 已 经 知道 怎么 用 了 , Python 的 class 中 有 许多 这 种 有 特殊 用 途 的 函数 , 可 以 帮 
助 我 们 定制 类 。 下 面 介绍 这 种 特殊 类 型 的 函数 定制 类 的 方法 。 


1._str 
开始 介绍 之 前 ， 我 们 先 定义 一 个 Student 类 ， 定 义 如 下 : 
#! /usr/bin/python3 


#-*- coding:UTF-8 -*- 


class Student(objecb: 
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def _init (self, name): 
selfname = name 

print(Student('xiaozhi')) 

执行 结果 如 下 : 

<_ main .Student object at Ox0000000000D64198> 

执行 结果 输出 一 堆 字 符 串 ， 一 般 人 看 不 懂 ， 没 有 什么 可 用 性 ， 也 不 好 看 。 怎 样 才能 输出 


得 好 看 呢 ? 





只 需要 我 们 定义 好 _str_() 方 法 , 返回 一 个 好 看 的 字符 串 就 可 以 了 。 重新 定义 上 面 的 示例 : 
#! /usr/bin/python3 
# -#- coding:UTF-8 -*- 


class Student(object): 
def _init _ (self name): 
selfname = name 


def _ str_ (self): 
return ' 学 生 名 称 : %s' % self.name 

print(Student('xiaozhi'")) 
执行 结果 为 : 
学 生 名 称 : xiaozhi 
由 执行 结果 看 到 ， 这 样 输出 的 实例 不 但 好 看 ， 而 且 是 我 们 想 要 的 。 
如 果 在 交互 模式 下 输入 如 下 : 
>>> s = Student('xiaozhi') 


>>>s 
<_ main .Student object at Ox00000000030EC550> 


由 执行 结果 看 到 ， 输 出 的 实例 还 跟 之 前 一 样 ， 不 容易 识别 。 
这 是 因为 直接 显示 变量 调用 的 不 是 _str (0， 而 是 _repr_()， 两 者 的 区 别 在 于 _ str_0 返 


回 用 户 看 到 的 字符 串 ， 而 _repr 0 返回 程序 开发 者 看 到 的 字符 串 。 也 就 是 说 ，_repr _0 〇 是 为 
调试 服务 的 。 


解决 办 法 是 再 定义 一 个 _repr_()。 通 常 ，_str_() 和 _ repr_(0 代 码 是 一 样 的 ， 所 以 有 一 





个 偷懒 的 写法 : 


#! /usr/bin/python3 
# -#- coding:UTF-8 -*- 


“203% 
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class Student(object): 
def init (self, name): 


self.name = name 


def str (self): 
return ' 学 生 名 称 : %s' % self.name 
_ repr =_ str 


在 交互 模式 下 执行 : 
>>> s = Student('xiaozhi') 


>>>s 


学 生 名 称 : xiaozhi 

可 以 看 到 ， 已 经 得 到 满意 的 结果 了 。 

2. _iter 

如 果 想 将 一 个 类 用 于 for… in 循环 ,类 似 list 或 tuple 一 样 , 就 必须 实现 一 个 _iter_ 0 方法。 
该 方法 返回 一 个 迭代 对 象 ，Python 的 for 循环 会 不 断 调用 该 迭代 对 象 的 _next_() 方 法 ， 获 得 
循环 的 下 一 个 值 ， 直 到 遇 到 StopIteration 错误 时 退出 循环 。 

我 们 以 斐 波 那 契 数 列 为 例 ， 写 一 个 可 以 作用 于 for 循环 的 Fib 类 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 





class Fib(object): 
def _init (self): 
self.a, self.b = 0, 1 # 初始 化 两 个 计数 器 a、b 


def _iter (self): 
return self# 实例 本 身 就 是 欠 代 对 象 ， 故 返回 自己 


def next (self): 
selfa, selfb = self.b, selfa + self.b# 计算 下 一 个 值 
让 selfa> 100000:# 退出 循环 的 条 件 
raise Stoplteration(); 
return self.a# 返回 下 一 个 值 


下 面 我 们 把 Fib 实例 作用 于 for 循环 。 
>>> for n in Fib(): 
print(n) 
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mm 一 


89 
3. _getitem_ 
Fib 实例 虽然 能 够 作用 于 for 循环 ， 和 list 有 点 像 ， 但 是 不 能 将 它 当 成 list 使用。 比如 取 第 
3 个 元 素 : 
>>> Fib0[3] 
Traceback (most recent call last): 
File "<pyshell#35>", line 1, in <module> 

FibO)[3] 

TypeError: 'Fib object does not support indexing 


由 执行 结果 看 到 ， 取 元 素 时 报错 了 。 怎 么 办 呢 ? 
要 像 list 一 样 按照 下 标 取出 元 素 ， 需 要 实现 _getitem_0 〇 方法， 代码 如 下 : 
class Fib(object): 
def getitem (self, n): 
ab=1,1 
forx in range(n): 
a,b=b,a+b 
return a 
下 面 尝 试 取得 数列 的 值 : 
>>> fib= Fib() 
>>> fib[3] 
3 


>>> fib[10] 
89 


由 执行 结果 看 到 ， 可 以 成 功 获取 对 应 数列 的 值 了 。 
4. _ getattr _ 


正常 情况 下 ， 调 用 类 的 方法 或 属性 时 ， 如 果 类 的 方法 或 属性 不 存在 就 会 报错 。 比 如 定义 
Student 类 : 





class Student(object): 
def init (self, name): 


self.name = 'xiaozhi' 
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对 于 上 面 的 代码 , 调用 name 属性 不 会 有 任何 问题 , 但 是 调用 不 存在 的 score 属性 就 会 报错 。 
执行 以 下 代码 : 
>>> stu = Student(} 
>>> print(stu.name) 
Xiaozhi 
>>> print(stu.score) 
Traceback (most recent call last): 
File "<pyshell#50>", line 1, in <module> 

print(stu.score) 

AttributeError: 'Student object has no attribute 'score' 


由 输出 结果 看 到 ， 错 误 信息 告诉 我 们 没有 找到 score 属性 。 对 于 这 种 情况 ， 有 什么 解决 方 
法 吗 ? 
要 避免 这 个 错误 ， 除了 可 以 添加 一 个 score 属性 外 ，Python 还 提供 了 另 一 种 机 制 ， 就 是 写 
-个 _getattr _() 方 法 ， 动 态 返 回 一 个 属性 。 上 面 的 代码 修改 如 下 : 
class Student(object): 


def init (self): 
Selfname = 'xiaozhi' 


def getattr (self, attr): 
证 attr 一 'sScore': 
return 95 


当 调 用 不 存在 的 属性 时 (如 score) ，Python 解释 器 会 调用 ”getattr _(self，'score) 尝 试 获 
得 属性 ， 这 样 就 有 机 会 返回 score 的 值 。 在 交互 模式 下 输入 如 下 : 


>>> stu = Student() 
>>> stu.name 
xiaozhi 

>>> stu.score 

95 


由 输出 结果 看 到 ， 可 以 正确 输出 不 存在 的 属性 的 值 了 。 

注意 ， 只 有 在 没有 找到 属性 的 情况 下 才 调 用 _ getattr _， 已 有 的 属性 〈 如 name) ， 不 会 在 
_ getattr_ 中 查找 。 此 外 ， 如 果 所 有 调用 都 会 返回 None (如 stu.abc) ， 就 是 定义 的 _ getattr _ 
默认 返回 None。 





5._call 


-个 对 象 实例 可 以 有 自己 的 属性 和 方法 ， 调 用 实例 的 方法 时 使 用 instance.methodO 调 用 。 
能 不 能 直接 在 实例 本 身 调 用 呢 ? 答案 是 可 以 。 
任何 类 ， 只 需要 定义 一 个 _call_() 方 法 ， 就 可 以 直接 对 实例 进行 调用 ， 例 如 : 
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class Student(object): 
def _init (self, name): 


selfname = name 


def call (self): 
print( 名 称 : %s' % self.name) 

在 交互 模式 下 输入 如 下 : 
>>> stu = Student('xiaomeng’) 
>>> stu() 
名 称 : xiaomeng 
由 输出 结果 看 到 ， 可 以 直接 对 实例 进行 调用 并 得 到 结果 。 
_ call_(0 还 可 以 定义 参数 。 对 实例 进行 直接 调用 就 像 对 一 个 函数 调用 一 样 ， 完 全 可 以 把 


对 象 看 成 函数 ， 把 函数 看 成 对 象 ， 因 为 这 两 者 本 来 就 有 根本 区 别 。 

如 果 把 对 象 看 成 函数 ， 函 数 本 身 就 可 以 在 运行 期 间 动态 创建 出 来 ， 因 为 类 的 实例 都 是 运 
行 期 间 创 建 出 来 的 。 这 样 一 来 ， 就 模糊 了 对 象 和 函数 的 界限 。 

怎么 判断 一 个 变量 是 对 象 还 是 函数 呢 ? 

很 多 时 候 判 断 一 个 对 象 是 否 能 被 调用 ， 可 以 使 用 Callable0 函 数 ， 比 如 函数 和 上 面 定义 的 
带 有 __call_() 的 类 实例 。 输 入 如 下 : 

>>> callable(Student('xiaozhi)) 

True 

>>> callable(max) 

True 

>>> callable([1, 2, 3]) 

False 

>>> callable(None) 

False 

>>> callable('a') 

False 


由 操作 结果 看 到 ， 通 过 callable0) 函 数 可 以 判断 一 个 对 象 是 否 为 “可 调用 ”对 象 。 





8.10 牛刀 小 出 行 建议 

小 智 今天 想 出 去 ， 但 不 清楚 今天 的 天 气 是 否 适 宜 出 行 ， 需 要 一 个 帮 他 提供 建议 的 程序 ， 
程序 要 求 输入 daytime 和 night， 根 据 可 见 度 和 温度 给 出 出 行 建议 和 使 用 的 交通 工具 ， 需 要 考 
虑 需求 变更 的 可 能 。 

需求 分 析 : 使 用 本 章 所 学 的 封装 、 继 承 、 多 态 比较 容易 实现 ， 由 父 类 封装 查看 可 见 度 和 
查看 温度 的 方法 ， 子 类 继承 父 类 。 若 有 需要 ， 子 类 可 以 覆盖 父 类 的 方法 ， 做 自己 的 实现 。 子 类 
也 可 以 自 定 义 方 法 。 
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定义 天 气 查 找 类 ， 类 中 定义 两 个 方法 ， 一 个 方法 根据 传 入 的 input_daytime 值 返回 对 应 的 
可 见 度 ; 另 一 个 方法 根据 传 入 的 input_daytime 值 返 回 对 应 的 温度 。 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


class WeatherSearch(object): 
def init (self, input_daytime): 
Selfinput daytime = input_daytime 


def seach visibility(self): 
visible leave=0 
if self.input_daytime 一 'daytime': 
visible_ leave=2 
if self.input_daytime 一 ‘night': 
visible leave=9 
return visible_leave 


def seach_ temperature(self): 
temperature = 0 
if self.input_daytime 一 'daytime' 
temperature = 26 
if self.input_daytime 一 'night': 
temperature = 16 
return temperature 


定义 建议 类 ， 该 类 继承 WeatherSearch 类 。 类 中 定义 两 个 方法 ， 一 个 覆盖 父 类 的 温度 查找 
方法 , 具有 传 入 的 input_daytime 的 值 ， 返 回 建议 使 用 的 交通 工具 ; 另 一 个 方法 返回 整体 的 建议 。 

#! /ust/bin/python3 

#-*- coding:UTF-8 -*- 





class OutAdvice(WeatherSearch): 
def _init (self, input_daytime): 
WeatherSearch. _ init_ (self, input_daytime) 


def seach_ temperature(self): 


vehicle= 

if self.input_daytime 一 'daytime' 
Vehicle = 'bike' 

让 selfinput daytime 一 ‘night': 
Vehicle = 'taxi 

Teturn vehicle 
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def out_ advice(self): 
Visible_ leave = self.seach visibility() 
证 visible _ leave == 2: 
print(The weather is good,suitable for use %s.' % self.seach_temperature()) 
elif visible_ leave 一 9: 
Print(The weather is bad,you should use %s.' % self.seach_temperature()) 
else: 
print(The weather is beyond my scope,I can not give you any advice) 


程序 调用 如 下 : 


check = OutAdvice('daytime') 
check.out_advice() 


结果 如 下 : 


The weather is good,suitable for use bike. 


8.11 调 试 


在 程序 运行 的 任何 时 刻 为 对 象 添加 属性 都 是 合法 的 ， 不 过 应 当 避 免 让 对 象 拥有 相同 的 类 


型 却 有 不 同 的 属性 组 。 
在 init 方法 中 初始 化 对 象 的 全 部 属性 是 一 个 好 习惯 , 可 以 帮助 你 用 户 更 好 地 管理 类 中 的 属 
性 和 对 属性 值 的 更 改 。 


继承 会 给 调试 带 来 新 挑战 ， 因 为 当 你 调用 对 象 的 方法 时 ， 可 能 无 法 知道 调用 的 是 哪 一 个 
方法 。 一 旦 无 法 确认 程序 的 运行 流程 ,最 简单 的 解决 办 法 是 在 适当 位 置 添加 一 个 输出 语句 ,如 
在 相关 方法 的 开头 或 方法 调用 开始 处 等 。 


8.12 问题 解答 


(1) 双 下 划 线 开头 的 实例 变量 一 定 不 能 从 外 部 访问 吗 ? 
答 : 不 是 。 不 能 直接 访问 _score 是 因为 Python 解释 器 对 外 把 _score 变量 改 成 了 
_Student_score， 所 以 仍然 能 够 通过 Student _score 访问 _score 变量 ， 例 如 : 


class Student(objecb: 
def init (self name, score): 
self. name=name 


self._ score = Score 


def info(self): 
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print( 学 生 : %s; 分 数 : %s' % (self__name, self._score)) 


stu= Student('xiaomeng', 95) 
print(' 分 数 : ', stu._Student_score) 


执行 结果 为 : 
分 数 : 95 


(2) 方法 与 函数 有 什么 区 别 ? 

答 : 在 Python 中 ， 函 数 并 不 依附 于 类 ， 也 不 在 类 中 定义 。 而 方法 依附 于 类 ， 定 义 在 类 中 ， 
本 质 上 还 是 一 个 函数 。 为 便于 区 分 , 我 们 将 类 中 的 函数 称 为 方法 , 不 依赖 于 类 的 函数 仍然 称 为 
函数 。 

(3) 为 什么 要 使 用 类 ? 

答 : 在 Python 中 ， 借 助 继承 、 多 态 、 封 装 三 大 特性 ， 使 用 类 可 以 更 好 地 对 一 类 事物 进行 
管理 ,可 以 将 具有 相同 功能 或 行为 的 事物 封装 成 一 个 类 , 其 他 具有 相同 特性 的 类 直接 继承 该 类 ， 
即 可 获得 父 类 封装 好 的 功能 , 同时 子 类 可 以 覆盖 父 类 的 方法 ,以 满足 特定 的 功能 需求 。 子 类 也 
可 以 扩展 自己 的 功能 。 使 用 类 可 以 更 好 地 实现 代码 的 复 用 和 扩展 。 


8.13” 温 故 知 新 ， 学 以 致 用 


本 章 主 要 讲解 了 类 、 类 的 使 用 、 类 的 特性 等 。 在 本 章 结束 前 让 我 们 回顾 一 下 学 到 的 内 容 。 
(1) 什么 是 类 ? 如 何 使 用 类 ? 

(2) 为 什么 要 有 类 的 构造 方法 ?使 用 构造 方法 有 什么 好 处 ? 

(3) 类 有 哪些 访问 权限 ? 都 怎么 使 用 ? 

(4) 继承 、 多 态 、 封 装 都 是 怎么 体现 的 ? 

(5) 类 有 哪些 专 有 方法 ? 


尝试 思考 并 解决 如 下 问题 : 
将 图 8-2 实现 为 具体 的 类 ， 分 别 为 继承 树 中 的 3 个 层次 添加 不 同 的 方法 ， 例 如 : 


(1) 定义 一 个 Animal 类 ， 用 Animal 的 _init 0 方法 做 一 些 值 的 初始 化 ， 并 在 Animal 
中 封装 一 个 所 有 动物 都 有 的 动作 行为 的 方法 。 

(2) 分 别 为 Mammal 和 Bird 定义 一 个 类 ， 继 承 Animal 类 ， 并 定义 一 些 各 自 拥有 特殊 动 
作 行为 的 方法 ， 并 实现 多 态 。 

(3) 分 别 为 第 3 层 的 4 个 动物 定义 一 个 类 ， 实 现 多 重 继 承 和 多 态 ， 并 进行 适当 扩展 。 
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s 9 = 有 


前 面 对 于 程序 运行 过 程 中 出 现 的 不 正常 , 我 们 要 么 称 之 
为 错误 ， 要么 称 之 为 异常 要么 说 程序 没有 按 预 期 运行 ， 在 
本 章 终 于 有 了 一 个 统一 的 称谓 一 一 异常 。 

本 章 将 带领 读者 学 习 如 何 处 理 各 种 异常 , 以 及 创建 和 自 
定义 异常 。 





A 
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本 节 开 始 介绍 之 前 ， 先 看 看 如 下 程序 : 


>>> print(a) 
Traceback (most recent call last): 
File "<pyshell#1>", line 1, in <module> 
Print(a) 

NameError: name 'a' is not defined 

是 不 是 很 熟悉 ， 这 是 我 们 前 面 经 常 看 到 的 程序 运行 出 现 的 错误 。 

作为 Python 初学 者 ， 在 学 习 Python 编程 的 过 程 中 ， 经 常会 看 到 一 些 报错 信息 ， 使 你 编写 
的 程序 不 能 如 期 工作 ， 如 我 们 前 面 看 到 过 的 NameError、SyntaxError、TypeError、ValueError 
等 ， 这 些 都 是 异常 。 

异常 是 一 个 事件 ， 该 事件 会 在 程序 执行 过 程 中 发 生 ， 影 响 程 序 的 正常 执行 。 一 般 情况 下 ， 
在 Python 无 法 正常 处 理 程序 时 就 会 发 生 异常 。 异 常 是 Python 的 对 象 , 表示 一 个 错误 。 当 Python 
脚本 发 生 异 常 时 ， 我 们 需要 捕获 并 处 理 异 常 ， 否 则 程序 会 终止 执行 。 

每 一 个 异常 都 是 一 些 类 的 实例 ， 这 些 实例 可 以 被 引用 ， 并 且 可 以 用 很 多 种 方法 进行 捕捉 ， 
使 得 错误 可 以 被 处 理 ， 而 不 是 让 整个 程序 失败 。 





9.2 ”异常 处 理 


出 现 异常 怎么 办 呢 ? 

就 如 我 们 使 用 的 工具 出 了 点 小 毛病 ， 我 们 可 以 想 办 法 修理 好 它 。 程 序 也 一 样 ， 前 辈 们 经 
过 不 断 积 累 与 思考 ， 创 造 了 不 少 好 方法 处 理 程序 中 的 异常 ， 最 简单 的 是 使 用 try 语句 处 理 。 

try 语句 的 基本 形式 为 try/except。try/except 语句 用 来 检测 try 语句 块 中 的 错误 ， 从 而 让 
except 语句 捕获 异常 信息 并 处 理 。 如 果 你 不 想 在 发 生 异 常 时 结束 程序 ， 只 需 在 try 语句 块 中 捕 


获 异常 即 可 。 
捕获 异常 的 语法 如 下 : 
try: 
< 语句 > # 运 行 别 的 代码 
except < 名 字 >: 
< 语句 > # 如 果 在 try 部 分 引发 了 异常 


try 的 工作 原理 是 ， 开 始 一 个 try 语句 后 ，Python 就 在 当前 程序 的 上 下 文中 做 标记 ， 当 出 
现 异 常 时 就 可 以 回 到 做 标记 的 地 方 。 首 先 执行 try 子 句 ， 接 下 来 发 生 什么 依赖 于 执行 时 是 否 出 
现 异 常 。 





A Sy 
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如 果 try 后 的 语句 执行 时 发 生 异 常 ， 程 序 就 跳 回 try 并 执行 except 子 句 。 异 常 处 理 完毕 ， 
控制 流 就 可 以 通过 整个 try 语句 了 〔 除 非 在 处 理 异常 时 又 引发 新 异常 )。 

如 以 下 示例 所 示 : 

#1/usr/bin/python3 

#-*- coding:UTF-8 -*- 


def exp_exception(x,y): 
try: 
a=X/y 
print(a=', a) 
return a 
except Exception: 
print( 程 序 出 现 异常 ， 异 常 信息 : 被 除数 为 0') 


exp_exception(2, 0) 

程序 执行 结果 如 下 : 

程序 出 现 异常 ， 异 常 信 息 : 被 除数 为 0 

由 执行 结果 看 到 ， 程 序 最 后 执行 的 是 except 子 句 ， 如 果 语 句 正常 ， 应 该 输出 “a=” 的 形式 。 

这 里 你 可 能 会 有 疑问 : 直接 在 做 除法 前 对 y 值 进 行 判断 不 就 解决 问题 了 ， 何 必 使 用 
try/except 语句 呢 ? 

在 本 例 中 这 么 做 确实 更 好 一 些 。 如 果 给 程序 加 入 更 多 除法 ， 就 得 给 每 个 除法 语句 加 一 个 
判断 语句 ， 这 样 整个 代码 看 上 去 就 是 一 堆 类 似 if 的 功能 重复 判断 语句 ， 真 正 有 效 的 代码 没 多 
少 。 而 使 用 try/except 只 需要 一 个 错误 处 理 器 即 可 。 


如 果 没 有 处 理 异 常 ， 异 常 就 会 被 “传播 ”到 调用 的 函数 中 。 如 果 在 调用 的 函数 中 依然 没 
有 处 理 ， 异 常 就 会 继续 “传播 ”， 直 到 程序 的 最 顶层 。 也 就 是 可 以 处 理 其 他 人 程序 中 未 
处 理 的 异常 。 


9.3 抛 出 异常 


Python 使 用 raise 语句 抛 出 一 个 指定 异常 。 我 们 可 以 使 用 类 〈Exception 的 子 类 ) 或 实例 参 
数 调用 raise 语句 引发 异常 。 使 用 类 时 程序 会 自动 创建 实例 。 
例如 : 


>>> raise Exception 
Traceback (most recent call last): 
File "<pyshell#1>", line 1, in <module> 
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raise Exception 
Exception 
>>> raise NameError('This is NameEror) 
Traceback (most recent call last): 
File "<pyshell#0>", line 1, in <module> 
raise NameError(This is NameError) 
NameError: This is NameError 


由 操作 结果 看 到 ， 第 一 个 示例 raise Exception 引发 了 一 个 没有 相关 错误 信息 的 普通 异常 ， 
第 二 个 示例 输出 了 一 些 错误 提示 。 
如 果 只 想 知道 是 否 抛 出 了 异常 ， 并 不 想 处 理 ， 使 用 一 个 简单 的 raise 语句 就 可 以 再 次 把 异 
常 抛 出 ， 例 如 : 
>>> try: 
raise NameError('This is NameError’) 


except NameError: 
print('An exception happened!') # 后 面 不 加 raise 


An exception happened!# 不 加 raise， 输 出 对 应 字符 就 结束 


>>> try: 
raise NameError('This is NameError’) 
except NameError: 
print('An exception happened!') 
raise ”# 最 后 加 一 个 raise 


An exception happened! 
Traceback (most recent call last): 
File "<pyshell#11>", line 2, in <module> 
raise NameError('This is NameError) 


NameError: This is NameError 
由 输出 结果 看 到 ， 使 用 raise 可 以 输出 更 深层 次 的 异常 。 在 使 用 过 程 中 ， 可 以 借助 该 方法 
得 到 更 详尽 的 异常 信息 。 
我 们 前 面 碰 到 的 NameError、SyntaxError、TypeError、ValueError 等 异常 类 称 为 内 建 异常 
类 。 在 Python 中 ， 内 建 的 异常 类 有 很 多 ， 可 以 使 用 dir 函数 列 出 异常 类 的 内 容 ， 并 用 在 raise 
语句 中 ， 用 法 如 raise NameError 这 般 。 表 9-1 描述 了 一 些 重 要 的 内 建 异常 类 。 
表 9-1 ”Python 重要 的 内 建 异常 类 


异常 名 称 描述 





常规 错误 的 基 类 
对 象 没有 这 个 属性 


Exception 





AttributeError 
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( 续 表 ) 
异常 名 称 描述 
IOError 输入 /输出 操作 失败 
IndexEror 序列 中 没有 此 索引 (index) 
KeyError 映射 中 没有 这 个 键 
NameError 未 声明 /初始 化 对 象 ( 没 有 属性 ) 
SyntaxError Python 语法 错误 
SystemError 一 般 解 释 器 系统 错误 
ValueError 传 入 无 效 的 参数 





9.4 捕捉 多 个 异常 


我 们 在 前 面 讲述 了 处 理 一 个 异常 的 情况 ， 若 涉及 多 个 异常 ， 该 怎么 处 理 呢 ? 
Python 支持 在 一 个 try/except 语句 中 处 理 多 个 异常 ， 语 法 如 下 : 


try: 

< 语句 > # 运 行 别 的 代码 

except < 名 字 1>: 

< 语句 > # 如 果 在 try 部 分 引发 了 namel 异常 
except < 名 字 2>，< 数 据 >: 

< 语句 > # 如 果 引 发 了 name2 异常 ， 获 得 附加 数据 


try 语句 按照 如 下 方式 工作 : 

首先 ， 执 行 try 子 句 〈 在 关键 字 try 和 关键 字 except 之 间 的 语句 ) 。 如 果 没 有 发 生 异 常 ， 
忽略 except 子 句 ，try 子 句 执行 后 结束 。 如 果 在 执行 try 子 句 的 过 程 中 发 生 异 常 ，try 子 句 余 下 
的 部 分 就 会 被 忽略 。 如 果 异 常 的 类 型 和 except 之 后 的 名 称 相 符 ， 对 应 的 except 子 句 就 会 被 执 
行 。 最 后 执行 try 语句 之 后 的 代码 。 如 果 一 个 异常 没有 与 任何 except 匹配 ， 这 个 异常 就 会 传递 
到 上 层 的 try 中 。 一 个 try 语句 可 能 包含 多 个 except 子 句 ， 分 别处 理 不 同 的 异常 ， 但 最 多 只 有 

-个 分 支 会 被 执行 。 

处 理 程序 将 只 针对 对 应 try 子 句 中 的 异常 进行 处 理 ， 而 不 会 处 理 其 他 异常 语句 中 的 异常 ， 
例如 : 

#!/usr/bin/python3 

# -*- coding:UTF-8 -*- 


def mult_exception(x,y): 
try: 
a=X/y 
b=name 


except ZeroDivisionError: 
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print('this is ZeroDivisionError) 
except NameError: 
print('this is NameError) 
mult exception(2,0) 
执行 结果 如 下 : 
This is ZeroDivisionEror 
若 把 a= x/y 注释 掉 或 放 到 b = name 下 面 ， 则 得 到 的 执行 结果 为 : 
This is NameError 


由 执行 结果 看 到 ， 一 个 try 可 包含 多 个 except 子 句 ， 但 子 句 中 只 有 一 个 分 支 会 被 处 理 。 

当然 ， 你 可 能 会 考虑 使 用 if 语句 ， 但 这 样 需 要 考虑 是 否 做 了 除法 运算 ， 做 除法 运算 时 是 
否 使 用 了 变量 ,是否 可 能 有 等 于 0 的 变量 用 作 被 除数 等 。 需 要 考虑 很 多 种 情况 ,也 需要 写 很 多 
让 语句 判断 ， 若 不 经 过 严密 思考 和 大 量 测试 ， 很 难 把 所 有 情况 都 考虑 到 。 此 外 ，if 语句 过 多 会 
使 程序 阅读 起 来 比较 困难 。 抛 出 异常 的 方式 更 加 简单 、 直 观 ， 可 以 清晰 帮助 用 户 定 位 问题 ， 并 
且 可 以 自 定义 异常 信息 ， 进 一 步 定位 问题 所 在 。 


9.5 ”使 用 一 个 块 捕捉 多 个 异常 


9.4 节 我 们 讲述 了 一 个 try 语句 对 应 多 个 except 子 句 , 若 需要 一 个 try 对 应 一 个 except 子 句 ， 
同时 捕捉 一 个 以 上 异常 ， 可 以 实现 吗 ? 我 们 先 看 如 下 示例 : 
#!/usr/bin/python3 
# -#- coding:UTF-8 -*- 
def model exception(x,y): 
try: 
b=name 
a=Xx/y 
except (ZeroDivisionError, NameError, TypeError): 
Print('one of ZeroDivisionError or NameError or TypeError happened') 
model_exception(2,0) 
程序 执行 结果 如 下 : 
one of ZeroDivisionError or NameError or TypeError happened 
由 执行 结果 看 到 ， 如 果 需 要 使 用 一 个 块 捕捉 多 个 类 型 异常 ， 可 以 将 它们 作为 元 组 列 出 。 
使 用 该 方式 时 ， 遇 到 的 异常 类 型 是 元 组 中 的 任意 一 个 ， 都 会 走 异常 流程 。 
这 么 做 有 什么 好 处 呢 ? 假如 我 们 希望 多 个 except 子 句 输出 同样 的 信息 ， 就 没有 必要 在 几 
个 except 子 句 中 重复 输入 语句 ， 放 到 一 个 异常 块 中 即 可 。 
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9.6 ”捕捉 对 象 


如 果 希 望 在 except 子 句 中 访问 异常 对 象 本 身 ， 也 就 是 看 到 一 个 异常 对 象 真正 的 异常 信息 ， 


而 不 是 输出 自己 定义 的 异常 信息 ， 可 以 使 用 as e 的 形式 ， 我 们 称 之 为 捕捉 对 象 。 示 例如 下 : 


#!/usr/bin/python3 
#-*- coding:UTF-8 -*- 
def model exception(x,y): 
try: 
b=name 
a=X/y 
except (ZeroDivisionError, NameError, TypeError) as e: 
Print(e) 
model_exception(2,0) 
执行 结果 如 下 : 
name name' is not defined 
若 a=x/y 在 前 ， 则 结果 如 下 : 


division by zero 


由 输出 的 结果 可 知 ， 执 行 过 程 中 抛 出 的 异常 被 截获 并 正常 输出 了 相关 异常 信息 ， 并 且 使 


用 这 种 方式 可 以 捕捉 多 个 异常 。 


在 Python 2 中 ， 捕 捉 对 象 的 子 句 写法 是 “Exception,e”， 中 间 使 用 “,” 号 分 隔 ， 而 不 是 


注 意 as。 此 处 的 e 也 可 以 使 用 其 他 字母 ， 用 e 意义 比较 明确 ， 取 自 except 的 首 字母 。 


9.7 全 捕捉 
前 面 我 们 讲述 了 很 多 异常 ， 读 者 可 能 以 为 可 以 捕 提 所 有 异常 ， 其 实 并 非 如 此 。 请 看 如 下 


#!/usr/bin/python3 
#-*- coding:UTF-8 -*- 
def model exception(x,y): 
try: 
b=name 


a=X/y 
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except (ZeroDivisionError, NameError, TypeError) as e: 
Print(e) 
model exception(2,") 
在 该 示例 中 ， 调 用 函数 时 有 一 个 实 参 传 入 的 是 空 值 。 执 行 结果 如 下 : 
unsupported operand type(s) for /: ‘int and 'str 


由 结果 看 到 ， 这 里 抛 出 的 信息 并 不 像 我 们 之 前 看 到 的 那样 ， 带 有 明显 的 Error 关键 词 或 异 
常 词 。 此 处 只 是 告知 不 支持 的 操作 类 型 。 

在 实际 编码 过 程 中 ， 即 使 程序 能 处 理 好 几 种 类 型 的 异常 ， 但 有 一 些 异 常 还 是 会 从 我 们 手 
掌中 溜 走 。 上 面 示例 中 的 异常 就 逃 过 了 try/except 语句 的 检查 ， 对 于 这 种 情况 我 们 根本 无 法 预 
测 会 发 生 什 么 ， 也 无 法 提前 做 任何 准备 。 在 这 种 情况 下 ， 与 其 使 用 不 是 捕捉 异常 的 try/except 
语句 隐藏 异常 ， 不 如 让 程序 立即 崩溃 。 

如 果 要 处 理 这 种 异常 ， 该 怎么 办 呢 ? 先 看 如 下 示例 : 

#!/usr/bin/python3 

#-*- coding:UTF-8 -*- 


def model_ exception(x,y): 
try: 
b=name 
a=X/y 
except: 
print(Error happened') 
model_exception(2,") 
执行 结果 如 下 : 
Error happened 


由 程序 和 执行 结果 看 到 ， 可 以 在 except 子 句 中 忽略 所 有 异常 类 ， 从 而 让 程序 输出 自己 定 
义 的 异常 信息 。 

当然 ， 这 里 只 给 出 了 一 种 可 参考 的 解决 方式 。 从 实用 性 方面 讲 ， 不 建议 这 么 做 ， 因 为 这 
样 捕捉 异常 非常 危险 , 会 隐藏 所 有 没有 预先 想到 的 错误 。 建议 使 用 抛 出 异常 的 方式 处 理 , 或 者 
对 异常 对 象 。 进行 一 些 检查 。 


9.8 ”异常 中 的 else 


如 果 程 序 执行 完 异常 还 需要 做 其 他 事情 ， 怎 么 办 呢 ? 
异常 为 我 们 提供 了 try...except..else 语句 实现 该 功能 ， 语 法 如 下 : 
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try: 

< 语句 > # 运 行 别 的 代码 

except < 名 字 >: 

< 语句 > # 如 果 在 try 部 分 引发 了 异常 1 
except < 名 字 >，< 数 据 >: 

< 语句 > # 如 果 引 发 了 异常 2， 获 得 附加 数据 
else: 

< 语句 > # 如 果 没 有 发 生 异 常 


如 果 在 try 子 句 执 行 时 没有 发 生 异 常 ， 就 会 执行 else 语句 后 的 语句 如果 有 else) 。 使 用 
else 子 句 比 把 所 有 语句 都 放 在 try 子 句 里 面 更 好 ， 这 样 可 以 避免 一 些 意 想不到 而 except 又 没 
有 捕获 的 异常 。 
例如 : 
#!/usr/bin/python3 
# -#- coding:UTF-8 -*- 
def model exception(x,y): 
try: 
a=Xx/y 
except: 
print(Error happened') 
else: 
print('It went as expected') 


model_exception(2,1) 

执行 结果 如 下 : 

It went as expected 

由 执行 结果 看 到 ， 没 有 发 生 异常 时 ， 会 执行 else 子 句 的 流程 。 

综 上 所 述 ， 当 程序 没有 发 生 异 常 时 ， 通 过 添加 一 个 else 子 句 做 一 些 事情 (比如 输出 一 些 
信息 ) 很 有 用 ， 可 以 帮助 我 们 更 好 地 判断 程序 的 执行 情况 。 


9.9 自 定 义 异 常 


尽管 内 建 异常 类 包括 了 大 部 分 异常 ,而且 可 满足 很 多 要 求 , 但 有 时 还 是 要 创建 自己 的 异常 类 。 
比如 需要 精确 知道 问题 的 根源 ， 就 需要 使 用 自 定义 异常 精确 定位 问题 。 可 以 通过 创建 一 个 新 
exception 类 拥有 自己 的 异常 。 异 常 应 该 继承 自 Exception 类 ， 可 以 直接 继承 ， 也 可 以 间接 继承 。 

因为 错误 就 是 类 ， 捕 获 一 个 错误 就 是 捕获 该 类 的 一 个 实例 ， 因 此 错误 并 不 是 凭空 产生 的 ， 
而 是 由 一 些 不 合理 的 部 分 导致 的 。Python 的 内 置 函 数 会 抛 出 很 多 类 型 的 错误 ， 我 们 自己 编写 
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的 函数 也 可 以 抛 出 错误 。 如 果 要 抛 出 错误 , 那么 可 以 根据 需要 定义 一 个 错误 的 类 ，, 选择 好 继承 
关系 ， 然 后 用 raise 语句 抛 出 一 个 错误 的 实例 。 
例如 : 
#!/usr/bin/python3 
#-*- coding:UTF-8 -*- 
class MyError(Exception): 
def _init (self): 
pass 
def str_ (self): 
return "this is self define error 
def my_error test(): 
try: 
raise MyError() 
except MyError as e: 
print('exception info:', e) 
my_error_test() 
执行 结果 如 下 : 
exception info: this is self define error 
由 程序 和 执行 结果 看 到 ， 程 序 正确 执行 了 自 定义 的 异常 ， 并 且 需 要 继承 Exception 类 。 
这 只 是 一 个 简单 的 示例 ， 还 有 不 少 细节 需要 琢 麻 ， 此 处 不 做 深入 探讨 ， 有 兴趣 的 读者 可 
以 查阅 相关 资料 进行 实践 。 


C7 异常 最 好 以 Error 结尾 ， 一 方面 贴近 标准 异常 的 命名 ， 另 一 方面 便于 见 名 知 意 。 
提 示 
9.10 finally 子 句 


Python 中 的 finally 子 句 需要 和 try 子 句 一 起 使 用 ， 组 成 try/finally 的 语句 形式 ，try/finally 
语句 无 论 发 生 异 常 与 否 都 将 执行 最 后 的 代码 。 

例如 : 
#1/usr/bin/python3 
# -*- coding:UTF-8 -*- 
def use_finally(x,y): 

try: 

a=X/y 
finally: 








Print(No matter what happened.I will show in front of you') 
use_finally(2,0) 
执行 结果 为 : 
No matter what happened,I will show in front of you 
Traceback (most recent call last): 
File "D:/python/workspace/exceptiontest.py", line 65, in <module> 
use_finally(2,0) 
File "D:/python/workspace/exceptiontest.py", line 61, in use_finally 
a=x/y 
ZeroDivisionError: division by zero 


由 执行 结果 看 到 ，finally 子 句 被 执行 了 , 无 论 try 子 句 中 是 否 发 生 异 常 ,finally 都 会 被 执行 。 
这 里 我 们 有 一 个 疑问 ， 虽 然 执 行 了 finally 子 句 ， 但 是 最 后 还 是 抛 异常 了 ， 是 否 可 以 使 用 
except 截获 异常 呢 ? 
可 以 使 用 except 截获 异常 。try、except、else 和 finally 可 以 组 合 使 用 ， 但 要 记得 else 在 
except 之 后 ，finally 在 except 和 else 之 后 。 对 于 上 面 的 示例 ， 可 以 更 改 如 下 : 
#!/usr/bin/python3 
# -#- coding:UTF-8 -*- 
def use_finally(x,y): 
try: 
a=X/y 
except ZeroDivisionError: 
Print('Some bad thing happened:division by zero) 
finally: 
Print(No matter what happened,I will show in front of you') 


use_finally(2,0) 
执行 结果 如 下 : 


Some bad thing happened:division by zero 
No matter what happenedI will show in front of you 


由 执行 结果 看 到 ， 先 执行 了 except 子 句 的 输出 语句 ， 后 面 跟着 执行 了 finally 子 句 的 输出 
语句 。 如 果 再 添加 else 子 句 ， 当 程序 正常 运行 时 会 先 执行 else 子 句 ， 然 后 执行 finally 子 句 。 
在 有 finally 的 异常 处 理 程序 中 ，finally 中 的 子 句 一 定 是 最 后 执行 的 。finally 子 句 在 关闭 文件 或 
数据 库 连接 时 非常 有 用 《文件 操作 和 数据 库 操作 后 面 会 具体 讲解 ) 。 





在 Python 2.5 之 前 的 版 本 中 ，finally 需要 独立 使 用 ， 不 能 与 try 语句 配合 。 在 Python 2.5 
所 示 之 后 才 支 持 这 些 语句 的 组 合 使 用 。 
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9.11 异常 和 函数 


异常 和 函数 能 够 很 自然 地 一 起 工作 。 如 果 异 常 在 函数 内 引发 而 不 被 处 理 ， 就 会 传播 至 函 
数 调用 的 地 方 。 如 果 异 常 在 函数 调用 的 地 方 也 没有 被 处 理 ， 就 会 继续 传播 ， 一 直到 达 主 程序 。 
如 果 在 主 程序 也 没有 做 异常 处 理 ， 异 常 就 会 被 Python 解释 器 捕获 ， 输 出 一 个 错误 信息 ， 然 后 
退出 程序 。 

例如 : 

#!/usr/bin/python3 

#-*- coding:UTF-8 -*- 

def division_fun(x, y): 

return x /int(y) 


def exp_fun(x, y): 
return division fun(x, y)* 10 


def main(x,y): 
exp_fun(x, y) 


main(2,0) 
执行 结果 如 下 : 
Traceback (most recent call last): 
File "D:/python/workspace/exceptiontest.py", line 14, in <module> 
main(2,0) 
File "D:/python/workspace/exceptiontest.py", line 12, in main 
exp_fun(x, y) 
File "D:/python/workspace/exceptiontest.py", line 9, in exp_fun 
return division fun(x, y)* 10 
File "D:/python/workspace/exceptiontest.py", line 6, in division_ fun 
return x / int(y) 


ZeroDivisionError: division by zero 

由 执行 结果 看 到 ，division_fun 函数 中 产生 的 异常 通过 division_fun 和 exp_fun 函数 传播 ， 
exp_fun 中 的 异常 通过 exp_fun 和 main 函数 传播 , 传递 到 函数 调用 处 由 解释 嚣 处理， 最 终 抛 出 
堆栈 的 异常 信息 。 


异常 信息 是 以 堆栈 的 形式 被 抛 出 的 ， 因 而 是 从 下 往 上 查看 的 。 所 谓 堆栈 ， 就 是 最 先 被 发 


现 的 异常 信息 最 后 被 输出 (就 像 子弹 入 弹 夹 和 出 弹 夹 一 样 ) ， 也 被 称 作 先进 后 出 (First In 
Last Out，FILO ) 。 








9.12 ”bug 的 由 来 


在 编程 的 过 程 中 ， 当 程序 出 现 问题 时 ， 我 们 就 会 说 出 bug 了 。bug 到 底 是 什么 意思 呢 ? 为 
什么 称 之 为 bug? 

bug 一 词 原本 的 意思 是 “臭虫 子 ” 或 “虫子 ”， 不 过 现在 我 们 更 多 将 其 认为 是 电脑 系统 或 
程序 中 隐藏 的 一 些 未 被 发 现 的 缺陷 或 漏洞 。 

在 20 世纪 40 年 代 ， 电 子 计算 机 非常 庞大 ， 数 量 也 非常 少 ， 主 要 用 于 军事 方面 。1944 年 
制造 完成 的 Mark1、1946 年 2 月 开始 运行 的 ENIAC 和 1947 年 完成 的 Mark I 是 赫赫 有 名 的 几 
台 计 算 机 。Mark I 是 由 哈佛 大 学 的 Howard Aiken 教授 设计 ， 由 IBM 公司 制造 的 ，Mark [I 是 
由 美国 海军 出 资 制造 的 。 与 使 用 电子 管制 造 的 ENIAC 不 同 ，Mark 1 和 Mark II 主要 使 用 开关 
和 继电器 制造 。 另 外 ，MarkI 和 Mark II 都 是 从 纸 带 或 磁带 上 读 取 指令 并 执行 ， 因 此 不 属于 从 
内 存 读 取 和 执行 指令 的 存储 程序 计算 机 (stored-program computer) 。 

1947 年 9 月 9 日 ，Mark II 计算 机 在 测试 时 突然 发 生 了 故障 。 经 过 几 个 小 时 的 检查 ， 工 作 
人 员 发 现 一 只 飞 蛾 被 打 死 在 面板 F 的 第 70 号 继电器 中 。 把 这 个 飞 蛾 取出 后 ， 机 器 便 恢复 了 正 
常 。 当 时 为 Mark II 计算 机 工作 的 著名 女 科 学 家 Grace Hopper 将 这 只 飞 蛾 粘贴 在 了 当天 的 工作 
手册 中 ， 并 在 上 面 加 了 一 行 注 释 First actual case of bug being found， 当 时 的 时 间 是 15:45。 随 
着 这 个 故事 的 广 为 流 传 ， 使 用 bug 一 词 指 代 计算 机 错误 的 人 越 来 越 多 ， 并 把 Grace Hopper 登 
记 的 那 只 飞 蛾 看 作 计 算 机 历史 上 第 一 个 被 记录 在 文档 中 的 bug。 





9.13” 温 故 知 新 ， 学 以 致 用 


本 章 主要 讲解 了 异常 处 理 和 自 定义 异常 ， 在 本 章 结束 前 回顾 一 下 学 到 的 概念 。 
(1) 异常 一 般 怎么 处 理 ? 

(2) 捕捉 异常 有 哪些 方式 ? 

(3) 如 何 自 定义 异常 ? 
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mAAA 日 期 和 时 间 


在 Python 中 ， 日 期 和 时 间 的 应 用 非常 普遍 。 在 实际 应 
用 中 ,大 部 分 数据 的 记录 和 日 志 的 处 理 都 需要 使 用 时 间 。 本 
章 将 具体 讲解 Python 中 日 期 和 时 间 的 使 用 。 
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10.1 日 期 和 时 间 


在 代码 中 ,我 们 常常 需要 与 时 间 打 交道 。 在 Python 中 ,与 时 间 处 理 有 关 的 模块 包括 time、 
datetime 以 及 calendar。 

在 Python 中 ， 通 常用 时 间 戳 、 格 式 化 的 时 间 字 符 串 和 元 组 3 种 方式 表示 时 间 。 下 面 分 别 
进行 讲解 。 


10.1.1 时 间 戳 


通常 ， 时 间 戳 (timestamp) 表示 从 1970 年 1 月 1 日 00 时 00 分 00 秒 开始 按 秒 计算 的 偏 
移 量 ， 也 就 是 从 1970 年 01 月 01 日 00 时 00 分 00 秒 (北京 时 间 1970 年 01 月 01 日 08 时 00 
分 00 秒 ) 起 到 现在 的 总 毫秒 数 。 

时 间 戳 是 一 个 经 加 密 后 形成 的 凭证 文档， 包括 3 部 分 : 


(1) 需 加 时 间 戳 的 文件 的 摘要 〈digest) 。 
(2) DTS 收 到 文件 的 日 期 和 时 间 。 
(3) DTS 的 数字 签名 。 


- 般 来 说 ， 时 间 戳 产生 的 过 程 为 : 用 户 首先 将 需要 加 时 间 戳 的 文件 用 Hash 编码 加 密 形成 
摘要 ， 然 后 将 该 摘要 发 送 到 DTS，DTS 加 入 收 到 文件 摘要 的 日 期 和 时 间 信 息 后 再 对 该 文件 加 
密 〈 数 字 签 名 ) ， 最 后 送 回 用 户 。 
书面 签署 文件 的 时 间 是 由 签署 人 自己 写 上 的 ， 而 数字 时 间 戳 是 由 认证 单位 DTS 添加 的 ， 
以 DTS 收 到 文件 的 时 间 为 依据 。 





【人 Python 3.5 中 支持 的 最 大 时 间 蕉 为 32535244799 (3001-01-01 15:59:59) 。 
提 示 


10.1.2 ”时 间 格 式 化 符号 
在 Python 中 ， 一 般 用 表 10-1 所 示 的 格式 化 符号 对 时 间 进 行 格式 化 。 
表 10-1 Python 格 式 化 符号 


格式 含义 备注 

%a 本 地 简化 星期 名 称 

%A 本 地 完整 星期 名 称 

%b 本 地 简化 月 份 名 称 

%B 本 地 完整 月 份 名 称 

%e 本 地 相应 的 日 期 和 时 间 表 示 

%d 一 个 月 中 的 第 几 天 (01~31) 

%H 一 天 中 的 第 几 个 小 时 〈24 小 时 制 ，00~23) 
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( 续 表 ) 
格式 含义 备注 
%Il 第 几 个 小 时 (12 小 时 制 ，01~12) 
%j 一 年 中 的 第 几 天 (001~366) 
%m 月 份 (01~12) 
%M 分 钟 数 〈00~59) 
%p 本 地 AM 或 PM 的 相应 符 1 
%S 秒 (01~61) 2 
%U 一 年 中 的 星期 数 〈 取 值 00~53， 星 期 天 为 一 星期 的 开始 )， 第 一 个 星期 天 之 前 的 所 有 天 数 都 | 3 
放 在 第 0 周 
%w 一 个 星期 中 的 第 几 天 〈0-6，0 是 星期 天 ) 3 





%W 和 %U 基本 相同 ， 不 同 的 是 %W 以 星期 一 为 一 个 星期 的 开始 
%x 本 地 相应 日 期 

%X 本 地 相应 时 间 

%y 去 掉 世 纪 的 年 份 〈00-99) 

%Y 完整 的 年 份 

%Z 时 区 的 名 字 (如 果 不 存 在 为 空 字 符 ) 

%% % 字 符 

















下 面 介绍 表 10-1 中 备注 中 3 个 数字 的 含义 。 

1: %p 只 有 与 %I 配合 使 用 才 有 效果 。 

2: 文档 中 强调 确实 是 0~61， 而 不 是 S9， 半 年 秒 占 两 秒 。 

3: 当 使 用 strptime0) 函 数 时 ， 只 有 这 一 年 的 周 数 和 天 数 确定 时 %U 和 %W 才 会 被 计算 。 

这 里 通过 表格 列 出 这 些 格式 化 符号 ， 读 者 可 以 大 概 了 解 一 下 ， 具 体 的 使 用 会 在 后 面 慢 慢 
渗入 。 
10.1.3 struct time 元 组 


struct_time 元 组 共有 9 个 元 素 : 年 、 月 、 日 、 时 、 分 、 秒 、 一 年 中 第 几 周 、 一 年 中 第 儿 天 、 
是 否 为 夏令 时 。 
Python 函数 用 一 个 元 组 装 起 来 的 9 组 数字 处 理 时 间 ， 也 被 称 作 struct_time 元 组 。 表 10-2 
列 出 了 这 种 结构 的 属性 。 
表 10-2 ”Python 的 时 间 元 组 














序号 属性 字段 值 
0 tm_year 4 位 数 年 如 2008 
1 tm_mon 月 1~12 
2 tm mday 日 1~31 
3 tm_hour 小 时 0-23 
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( 续 表 ) 
序号 属性 字段 值 
4 tm_min 分 钟 0~59 
5 tm sec 秒 0-~61 (60 或 61 是 闽 秒 ) 
6 tm wday 一 周 的 第 几 日 0-~6 (0 是 周一 ) 
区 tm_yday 一 年 的 第 儿 日 1~366 ( 儒 略 历 ) 
8 tm _isdst 夏令 时 -1、0、1、-1 是 决定 是 否 为 夏令 时 的 旗帜 





10.2 time 模块 


前 面 我 们 讲述 了 时 间 的 基本 概念 ， 本 节 将 具体 讲述 time 模块 中 的 一 些 常 用 函数 。time 模 
块 的 内 置 函 数 有 做 时 间 处 理 的 ， 也 有 转换 时 间 格 式 的 。 


10.2.1 time() 函 数 


time0) 函 数 用 于 返回 当前 时 间 的 时 间 戳 (1970 年 01 月 01 日 08 时 00 分 00 秒 到 现在 的 浮 
点 秒 数 ) 。 
time() 函 数 的 语法 如 下 : 





time.time() 

此 语法 中 第 一 个 time 指 的 是 time 模块 ， 该 函数 不 需要 传递 参数 。 
time 函数 返回 当前 时 间 的 时 间 戳 。 

该 函数 使 用 示例 如 下 : 

#! /usr/bin/python3 

#-*#- coding:UTF-8 -*- 


import time 


print(' 当 前 时 间 的 时 间 戳 : %f' % time.time()) 
执行 结果 为 : 
当前 时 间 的 时 间 戳 : 1474763819.543787 


10.2.2 localtime([secs]) 函 数 


localtimeO 函 数 的 作用 是 格式 化 时 间 戳 为 本 地 时 间 。 如 果 secs 参数 未 输入 ， 就 以 当前 时 
间 为 转换 标准 。 
localtime() 函 数 的 语法 如 下 : 


time.localtime([secs]) 
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此 语法 中 time 指 的 是 time 模块 ，secs 指 转换 为 time.struct_time 类 型 的 对 象 的 秒 数 。 


该 
该 


函数 没有 任何 返回 值 。 
函数 使 用 示例 如 下 : 


import time 


print('time.localtime() : ', time.localtime()) 


执 


行 结果 为 : 


time.localtime() : time.struct_time(tm_year=2016, tm_mon=9, tm_mday=25, tm_hour=8, tm_min=51, 
tm_sec=42, tm wday=6, tm_ yday=269, tm _isdst=0) 


10.2.3 gmtime([secs]) 函 数 
gmtime() 函 数 用 于 将 一 个 时 间 戳 转换 为 UTC 时 区 (0 时 区 ) 的 struct_time, 可 选 的 参数 sec 


表示 从 


1970-1-1 到 现在 的 秒 数 ,gmtime() 函 数 的 默认 值 为 time.time(), 函数 返回 time.struct_time 


类 型 的 对 象 〈struct_time 是 在 time 模块 中 定义 的 表示 时 间 的 对 象 ) 。 
gmtime() 函 数 的 语法 如 下 : 


time.gmtime([secs]) 
此 语法 中 time 指 的 是 time 模块 ，secs 指 转换 为 time.struct_time 类 型 的 对 象 的 秒 数 。 


该 
该 


函数 没有 任何 返回 值 。 
函数 使 用 示例 如 下 : 


import time 


print(time.gmtime() : ', time.gmtime()) 


执 


行 结果 为 : 


time.gmtime(): time.struct_time(tm_year=2016, tm_mon=9, tm_mday=25, tm_hour=0, tm_min=56, 
tm_sec=22, tm_wday=6, tm_yday=269, tm _isdst=0) 


10.2.4 ” mktimel(t) 函 数 
mktime() 函 数 用 于 执行 与 gmtime()、localtime() 相 反 的 操作 ， 接 收 struct_time 对象 作 为 参 


数 ， 返 





回 用 秘 数 表示 时 间 的 浮 点 数 。 如 果 输 入 的 值 不 是 合法 时 间 ， 就 会 触发 OverflowError 或 


ValueError。 


mktime() 函 数 的 语法 如 下 : 


time.mktime(t) 


此 
返 
该 


语法 中 time 指 的 是 time 模块 ，t 指 结构 化 的 时 间或 完整 的 9 位 元 组 元 素 。 
回 用 秒 数 表示 时 间 的 浮 点 数 。 
函数 使 用 示例 如 下 : 








日 期 和 时 间 第 10 党 





import time 

t= (2016, 9, 25, 17, 35, 38, 6, 48, 0) 

Print (time.mktime(t) : %f % time.mktime(t)) 
执行 结果 为 : 

time.mktime(t) : 1474796138.000000 


10.2.5 ”asctime( 岂 ) 函 数 


asctime() 函 数 用 于 接收 时 间 元 组 并 返回 一 个 可 读 的 形式 为 Sun Sep 25 09:09:37 2016 (2016 
年 09 月 25 日 周 日 9 时 09 分 37 秒 ) 的 24 个 字符 的 字符 串 。 
asctime() 函 数 的 语法 如 下 : 
time.asctime([t]) 
此 语法 中 time 指 的 是 time 模 块 ,t 指 完整 的 9 位 元 组 元 素 或 通过 函数 gmtime()、localtime() 
回 的 时 间 值 。 
返回 一 个 可 读 的 形式 为 Sun Sep 25 09:09:37 2016 (2016 年 09 月 25 日 周 日 9 时 09 分 37 
秒 ) 的 24 个 字符 的 字符 串 。 
该 函数 使 用 示例 如 下 : 


import time 





这 





t= time.localtime() 
print (‘time.asctime(t): %s ' % time.asctime(t)) 


执行 结果 为 : 
time.asctime(t): Sun Sep 25 09:09:37 2016 


10.2.6 ctime([secs]) 函 数 


ctime0) 函 数 用 于 把 一 个 时 间 戳 〈 按 秒 计算 的 浮 点 数 ) 转化 为 time.asctime0O 的 形式 。 如 果 未 
指定 参数 secs 或 参数 为 None， 就 会 默认 将 time.time() 作 为 参数 。ctime 的 作用 相当 于 
asctime(localtime(secs))。 

ctime() 函 数 的 语法 如 下 : 

time.ctime([secs]) 

此 语法 中 time 指 的 是 time 模块 ，secs 指 要 转换 为 字符 串 时间 的 秒 数 。 

该 函数 没有 任何 返回 值 。 

该 函数 使 用 示例 如 下 : 


import time 
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print (‘time.ctime() : %s' % time.ctime()) 
执行 结果 为 : 


time.ctime() : Sun Sep 25 09:16:22 2016 


10.2.7 sleep(secs) 函 数 


sleep0 函 数 用 于 推迟 调用 线程 的 运行 ， 可 通过 参数 secs 指定 进程 挂 起 的 时 间 。 

sleep0) 函 数 的 语法 如 下 : 

time.sleep(secs) 

此 语法 中 time 指 的 是 time 模块 ，secs 指 推 迟 执行 的 秒 数 。 

该 函数 没有 返回 值 。 

该 函数 使 用 示例 如 下 : 

import time 

print ('Start : %s' % time.ctime()) 

time.sleep(5) 

print (End : %s' % time.ctime()) 

执行 结果 为 : 

Start : Sun Sep 25 09:22:36 2016 

End : Sun Sep 25 09:22:41 2016 

由 执行 结果 看 到 ， 输 出 的 时 间 相 隔 了 5 秒 。 
10.2.8 “clock() 函 数 

clock0) 函 数 用 于 以 浮 点 数 计算 的 秒 数 返回 当前 CPU 时 间 ， 用 来 衡量 不 同 程序 的 耗 时 ， 比 
timetime() 更 有 用 。 该 函数 在 不 同系 统 上 含义 不 同 。 在 UNIX 系统 上 ,返回 的 是 “进程 时 间 ”， 
是 用 秒表 示 的 浮 点 数 (时 间 戳 ) ; 在 Windows 中 ， 第 一 次 调用 返回 的 是 进程 运行 的 实际 时 间 ， 
第 二 次 之 后 的 调用 是 自 第 一 次 调用 后 到 现在 的 运行 时 间 。 

clock0) 函 数 的 语法 如 下 : 














time.clock() 

此 语法 中 time 指 的 是 time 模块 ， 该 函数 不 需要 参数 。 该 函数 有 两 个 功能 : 

(1) 在 第 一 次 调用 时 ， 返 回程 序 运行 的 实际 时 间 。 

(2) 第 二 次 之 后 的 调用 ， 返 回 自 第 一 次 调用 后 到 这 次 调用 的 时 间 间 隔 。 

在 Win32 系统 下 ，clock() 函 数 返 回 的 是 真实 时 间 (walltime) ， 而 在 UNIX/Linux 下 返回 
的 是 CPU 时 间 。 

该 函数 使 用 示例 如 下 : 





230% 
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import time 


def procedure(): 
time.sleep(2) 


# measure process time 

tl = time.clock() 

procedure() 

print('seconds process time : "time.clock() - t1) 


# measure wall time 

t2=time.time() 

procedure() 

print('seconds wall time : ',time.time() - 2) 

执行 结果 为 : 

seconds process time : 1.9991468375899508 

seconds wall time : 2.0001144409179688 

此 处 的 执行 结果 会 因 电 脑 的 不 同 而 有 所 差异 (精度 存在 误差 )。 
10.2.9 strftime(format[, 了 ) 函 数 


strftime() 函 数 用 于 接收 时 间 元 组 ， 并 返回 以 可 读 字符 串 表 示 的 当地 时 间 ， 格 式 由 参数 
format 决定 。 

strftime() 函 数 的 语法 如 下 : 

time.strftime(format[, t]) 

语法 中 time 指 的 是 time 模块 , format 指 格式 化 字符 串 ,t 指 可 选 的 参数 , 是 一 个 struct_time 

返回 以 可 读 字 符 串 表示 的 当地 时 间 。 

该 函数 使 用 示例 如 下 : 


import time 





t=(2016, 9, 25, 17, 50, 38, 6, 48, 0) 
t=time.mktime(t) 
print(time.strftime('%b %d %Y %H:%M:%S' time.gmtime(t))) 


执行 结果 为 : 


Sep 25 2016 09:50:38 
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10.2.10 ”strptime(string[, format]) 函 数 
strptime() 函 数 用 于 根据 指定 的 格式 把 一 个 时 间 字 符 串 解析 为 时 间 元 组 。 
strptime() 函 数 的 语法 如 下 : 
time.strptime(string[, format]) 


此 语法 中 time 指 的 是 time 模块 ，string 指 时 间 字 符 串 ，format 指 格式 化 字符 串 。 
返回 struct_time 对 象 。 
该 函数 使 用 示例 如 下 : 


import time 





struct_time = time.strptime("25 Sep 16", "%d %b %y") 

print(retumed tuple: ', struct_time) 

执行 结果 

retumed tuple: time.struct time(tm year=2016, tm_ mon=9, tm_ mday=25, tm_hour=0, tm_min=0, 


tm_sec=0, tm_wday=6, tm_yday=269, tm _isdst=-1) 


10.2.11 三 种 时 间 格 式 转化 


我 们 前 面 提 到 ，Python 中 有 3 种 表示 时 间 的 格式 。 这 3 种 时 间 格 式 可 以 相互 转化 ， 转 化 
方式 如 图 10-1 和 10-2 所 示 。 





















































struct time 9%a %b %d %H:%M:%5S %Y 串 
- EA 
2 ~、、、、localtime Re 
Strftime - ~、、~gmtime asctime -一 ctime 
/Apime mktims ps 
Format string Timestamp struct_time Timestamp 
图 10-1 时 间 格 式 转化 1 图 10-2 时间 格式 转化 2 


10.3 datetime 模块 


datetime 是 date 与 time 的 结合 体 ， 包 括 date 与 time 的 所 有 信息 。datetime 的 功能 强大 ， 
支持 0001 年 到 9999 年 。 

datetime 模块 定义 了 两 个 常量 : datetime.MINYEAR 和 datetime.MAXYEAR。 这 两 个 常量 
分 别 表示 datetime 所 能 表示 的 最 小 、 最 大 年 份 。 其 中 ，MINYEAR = 1，MAXYEAR = 9999。 

datetime 模块 定义 了 以 下 5 个 类 。 
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datetime.date: 表示 日 期 的 类 。 常 用 的 属性 有 year、month、day。 

datetime.time: 表示 时 间 的 类 。 常 用 的 属性 有 hour、minute、second、microsecond。 
datetime.datetime: 表示 日 期 时 间 。 

datetime.timedelta: 表示 时 间 间 隔 ， 即 两 个 时 间 点 之 间 的 长 度 。 

datetime.tzinfo: 与 时 区 有 关 的 相关 信息 。 


其 中 ，datetime.datetime 类 的 应 用 最 为 普遍 。 下 面 对 该 类 进行 一 些 详细 讲解 。 
datetime.datetime 类 中 有 以 下 方法 : 


1. today() 
today() 方 法 的 语法 如 下 : 
datetime.datetime.today() 


此 语法 中 datetime.datetime 指 的 是 datetime.datetime 类 。 
返回 一 个 表示 当前 本 地 时 间 的 datetime 对 象 。 
该 方法 使 用 示例 如 下 : 


import datetime 





Pprint('today is:', datetime.datetime.today()) 
执行 结果 为 : 

today is: 2016-09-25 15:37:08.900990 

2. now([tz]) 

now() 方 法 的 语法 如 下 : 
datetime.datetime.now([tz]) 


此 语法 中 datetime.datetime 指 的 是 datetime.datetime 类 ， 如 果 提 供 了 参数 tz， 就 获取 世人 参 
数 所 指 时 区 的 本 地 时 间 。 

返回 一 个 datetime 对 象 。 

该 方法 使 用 示例 如 下 : 


import datetime 








print(now is:', datetime.datetime.nowO) 
执行 结果 为 : 

now is: 2016-09-25 15:40:31.634641 

3. datetime.utcnow() 


utcnow() 方 法 的 语法 如 下 : 
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datetime.datetime.utcnow() 


此 语法 中 datetime.datetime 指 的 是 datetime.datetime 类 。 
返回 一 个 当前 utc 时 间 的 datetime 对 象 。 
该 方法 使 用 示例 如 下 : 


import datetime 





print(utcnow is:', datetime.datetime.utcnow()) 
执行 结果 为 : 

utcnow is: 2016-09-25 07:42:08.520898 

4. fromtimestamp(timestampl, tz]) 


根据 时 间 胸 创建 一 个 datetime 对 象 。 
fromtimestamp() 方 法 的 语法 如 下 : 
datetime.datetime.fromtimestamp(timestamp[, tz]) 


此 语法 中 datetime.datetime 指 的 是 datetime.datetime 类 ， 参 数 世 指定 时 区 信息 。 
返回 一 个 datetime 对 象 。 
该 方法 使 用 示例 如 下 : 


import datetime 





print('fromtimestamp is:', datetime.datetime.fromtimestamp(time.time())) 
执行 结果 为 : 
fromtimestamp is: 2016-09-25 15:58:42.704378 


5. utcfromtimestamp(timestamp) 
根据 时 间 吏 创建 一 个 datetime 对 象 。 
utcfromtimestamp() 方 法 的 语法 如 下 : 
datetime.datetime.utcfromtimestamp(timestamp) 


此 语法 中 datetime.datetime 指 的 是 datetime.datetime 类 ，timestamp 指 时 间 戳 。 
返回 一 个 datetime 对 象 。 
该 方法 使 用 示例 如 下 : 


import datetime 





print(utcfromtimestamp is:', datetime.datetime.utcfromtimestamp(time.time())) 
执行 结果 为 : 


utcfromtimestamp is: 2016-09-25 07:58:42.704378 
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6. strptime(date_string, format) 


将 格式 字符 串 转 换 为 datetime 对 象 。 
strptime() 方 法 的 语法 如 下 : 


datetime.datetime.strptime(date_string, format) 


此 语法 中 datetime.datetime 指 的 是 datetime.datetime 类 ，date_string 指 日 期 字符 串 ，format 


为 格式 化 方式 。 


返回 一 个 datetime 对 象 。 
该 方法 使 用 示例 如 下 : 


import datetime 





dt= datetime.datetime.now() 
Print('strptime is:', dt.strptime(str(dt), ‘YY-%m-%d %H:%M:%S.%f")) 


执行 结果 为 : 

strptime is: 2016-09-25 15:58:42.704378 

7. strftime(format) 

将 格式 字符 串 转换 为 datetime 对 象 。 
strftime() 方 法 的 语法 如 下 : 
datetime.datetime.strftime( format) 


此 语法 中 datetime.datetime 指 的 是 datetime.datetime 类 ，format 为 格式 化 方式 。 
返回 一 个 datetime 对 象 。 
该 方法 使 用 示例 如 下 : 


import datetime 





dt = datetime.datetime.now() 
print('strftime is: ', dt.strftime('%Y-%m-%d %H:%M:%S')) 


执行 结果 为 : 
strftime is: 2016-09-25 16:06:39 
下 面 看 一 个 使 用 时 间 格 式 化 符号 操作 datetime.datetime 类 的 示例 。 


#!/usr/bin/python 

#-*- coding:UTF-8 -*- 

dt = datetime.datetime .now() 

print(' 当 前 时 间 :', dt) 

Print((%Y-%m-%d WH:%M:%S % 有 :dtstrftime(%Y-%m-%d WH:%M:%S %f)) 
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print((%Y-%m-%d WH:%M:%S Wp): ', dt.strftime('%y-%m-%d %I%0M:%S Wp')) 
Print('%%a: %s ' % dt.strftime('%a')) 

Print('%%A: %s' % dt.strftime('%A')) 

Print('%%b: %s' % dt.strftime('%b')) 

print('%%B: %s ' % dt.strftime('%B')) 

print(' 日 期 时 间 %%c: %s' % dt.strftime('%c')) 

print(' 日 期 %%x: %s'% dt.strftime('%x')) 
print(' 时 间 %%X: %s'% dt.strftime('%X')) 
print(' 今 天 是 这 周 的 第 %s 天 '% dt.strftime(%w')) 
print(' 今 天 是 今年 的 第 %s 天 '% dt.strftime('%j')) 
print(' 这 周 是 今年 的 第 %s 周 '% dtstrftime('%U7) 
执行 结果 如 下 : 

当前 时 间 : ”2016-09-25 16:15:16.612006 
(%Y-Y%m-%d %H:%M:%S Wf): 2016-09-25 16:15:16 612006 
(%Y-Y%m-%d %H:%M:%S Wp): 16-09-25 04:15:16 PM 
%a: Sun 

%A: Sunday 

%b: Sep 

%B: September 

日 期 时 间 %c: Sun Sep 25 16:15:16 2016 

日 期 %x: 09/25/16 

时 间 %X: 16:15:16 

今天 是 这 周 的 第 0 天 

今天 是 今年 的 第 269 天 

这 周 是 今年 的 第 39 周 


10.4 日 历 模 块 


日 历 (Calendar) 模块 的 函数 都 与 日 历 相关 ， 如 输出 某 月 的 字符 月 历 。 星期 一 默认 是 每 周 
的 第 一 天 ,星期 天 是 默认 的 最 后 一 天 。 更 改 设置 需 调 用 calendar.setfirstweekday() 函 数 ， 模 块 包 
含 以 下 内 置 函数 日历 模 块 在 实际 项 目 中 使 用 并 不 多 ， 此 处 不 对 各 个 函数 做 具体 示例 列举 )。 


1. calendar.calendar(year,w=2,l=1,c=6) 


该 函数 返回 一 个 多 行 字 符 串 格式 的 year 年 历 ，3 个 月 一 行 ， 间隔 距 离 为 c。 每 日 宽度 间隔 
为 w 字符 。 每 行 长 度 为 21* W+18+2* C。1 是 每 星期 行 数 。 


2. calendarfirstweekday() 
返回 当前 每 周 起 始 日 期 的 设置 。 默认 情况 下 , 首次 载 入 calendar 模块 时 返回 0, 即 星 期 一 。 
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3. calendar.isleap(year) 

如 果 是 半年 就 返回 True， 否 则 返回 False。 
4. calendar.leapdays(y1,y2) 

返回 在 y1、y2 两 年 之 间 的 六 年 总 数 。 

5. calendarmonth(yearmonth,w=2,=1) 


返回 一 个 多 行 字符 串 格式 的 year 年 month 月 日 历 ， 两 行 标题 ， 一 周一 行 。 每 日 宽度 间隔 
为 w 字符 。 每 行 长 度 为 7* w+6。1 是 每 星期 的 行 数 。 
6. calendar.monthcalendar(year,month) 


返回 一 个 整数 的 单 层 嵌 套 列 表 。 每 个 子 列表 装载 代表 一 个 星期 的 整数 。year 年 month 月 
外 的 日 期 都 设 为 0， 范围 内 的 日 期 由 该 月 第 几 日 表示 ， 从 1 开始 。 














7. calendar.monthrange(year,month) 


返回 两 个 整数 。 第 一 个 是 该 月 星期 几 的 日 期 码 , 第 二 个 是 该 月 的 日 期 码 。 日 从 0 (星期 一 ) 
到 6 (星期 日 ) ， 月 从 1 到 12。 





8. calendar.prcal(year,w=2,l=1,c=6) 

相当 于 print(calendar.calendar(year,w,l,c))。 

9. calendar.prmonth(year,month,w=2,|=1) 

相当 于 print(calendar.calendar(year, w, 1, c))。 

10. calendar.setfirstweekday(weekday) 

设置 每 周 的 起 始 日 期 码 ，0 (星期 一 ) 到 6 (星期 日 )。 

11. calendar.timegm(tupletime) 

和 time.gmtime 相反 ， 接 收 一 个 时 间 元 组 形式 ， 返 回 该 时 刻 的 时 间 戳 。 
12. calendar.weekday(year,month,day) 


返回 给 定 日 期 的 日 期 码 ，0 (星期 一 ) 到 6 (星期 日 ) 。 月 份 为 1 (1 月 ) 到 12 (12 月) 。 





10.5 -牛刀 小 试 一 一 时 间 大 杂烩 


自 定义 函数 , 使 用 Time、Calendar 和 datetime 模块 获取 当前 日 期 前 后 N 天 或 N 月 的 日 期 。 





Python 3.5 从 零 开 始 学 





#!/usr/bin/python 
#-*- coding:UTF-8 -*- 


year = strftime("%Y", localtime()) 
mon = strftime("%m", localtime()) 
day = strftime("%d", localtime()) 
hour = strftime("%H", localtime()) 
min = strftime("%M", localtimeO) 
sec =strftime("%S", localtime()) 


def today(): 


mn 


get today,date format="YYYY-MM-DD" 


mm 


Teturn date.today() 


def todaystr(): 


get date string, date format="YYYYMMDD" 


Im 


return year + mon + day 


def datetime(): 


get datetime,format="YYYY-MM-DD HH:MM:SS" 


return strftime("%Y-%m-%d %H:%M:%S", localtime()) 


def datetimestr(): 


mm 


get datetime string 
date format="YYYYMMDDHHMMSS" 


m 


return year + mon + day + hour + min + sec 


def get_day_of day(n=0): 


mm 


if n>=0,date is larger than today 
if n<0,date is less than today 
date format ="YYYY-MM-DD" 


m 
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ifn < 0: 

n=abs(n) 

Teturn date.today()-timedelta(days=n) 
else: 

Teturn date.today(0+timedelta(days=n) 


def get_ days_of month(year mon): 


mm 


get days of month 


mm 


return calendarmonthrange(year mon)[1] 


def get_firstday_of month(year mon): 
get the first day of month 
date format ="YYYY-MM-DD" 
days="01" 
if int(mon) < 10: 
mon = "0" + str(int(mon)) 
arr = (year, mon, days) 
return "-".join("%s" %i for i in arr) 


def get_lastday_of_month(year, mon): 
get the last day of month 
date format ="YYYY-MM-DD" 
days=calendarmonthrange(year mon)[1] 
mon = addzero(mon) 
arr = (year, mon, days) 


Teturn "-".join("%s" %i for i in arr) 


def get_firstday_month(n=0): 
get the first day of month from today 
nis how many months 
(y m, d) = getyearandmonth(n) 
d="01" 
ar=(y, m, d) 
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return "-".join("%s" %i fori in arr) 


def get_lastday_month(n=0): 
get the last day of month from today 
nis how many months 


mm 


Teturn "-".join("%s" %i fori in getyearandmonth(n)) 


def getyearandmonth(n=0): 
get the year,month,days from today 
befor or after n months 
thisyear = int(year) 
thismon = int(mon) 
totalmon = thismon + n 
ifn >= 0: 
if totalmon <= 12: 
days = str(get_days_of_month(thisyear, totalmon)) 
totalmon = addzero(totalmon) 
retum year, totalmon, days 
else: 





otalmon//12 
j=totalmon%12 
ifj = 0: 
i-=1 
j=12 
thisyear +=1 
days = str(get_days_of_ month(thisyear, j)) 
j= addzero0) 
return str(thisyear), str(j), days 


else: 


if totalmon > 0 and totalmon < 12: 
days = str(get_days_of month(thisyeartotalmon)) 
totalmon = addzero(totalmon) 
retum year totalmon, days 

else: 

i=totalmon//12 





j=totalmon%12 
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.=i12 
thisyear + 一 ii 
days = str(get_ days_of month(thisyear, j)) 
j= addzero(j) 
return str(thisyear), str(j), days 


def addzero(n): 
add 0 before 0-9 
return 01-09 
nabs = abs(int(n)) 
if nabs < 10: 
return "0" + str(nabs) 
else: 
return nabs 


def get_today_month(n=0): 
获取 当前 日 期 前 后 N 月 的 日 期 
ifn>0, 获取 当前 日 期 前 N 月 的 日 期 
ifn<0, 获取 当前 日 期 后 N 月 的 日 期 
date format ="YYYY-MM-DD" 
(y, m, d) = getyearandmonth(n) 
arr=(y, m, d) 
if int(day) < int(d): 

arr = (y, m, day) 

Teturn "-".join("%s" %i for i in arr) 


def get_firstday_month(n=0): 
(y, m, d) = getyearandmonth(n) 
arr=(y, m, '01') 


return "-".join("%s" %i for i in arr) 


def main(): 
print(today is:', today()) 
print(today is:', todaystr()) 
print('the date time is:', datetime()) 
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print('data time is:', datetimestr()) 

print('2 days after today is:', get_day_of day(2)) 

print('2 days before today is:', get_day_of day(-2)) 

print(2 months after today is:', get_today_ month(2)) 

print(2 months before today is:', get_today_month(-2)) 
print(2 months after this month is:', get_firstday_month(2)) 
print(2 months before this month is:', get_firstday_month(-2)) 


if_name —" main_": 
main() 

执行 效果 如 下 : 

today is: 2016-09-25 

today is: 20160925 

the date time is: 2016-09-25 11:27:14 

data time is: 20160925112714 

2 days after today is: 2016-09-27 

2 days before today is: 2016-09-23 

2 months after today is: 2016-11-25 

2 months before today is: 2016-07-25 

2 months after this month is: 2016-11-01 

2 months before this month is: 2016-07-01 


10.6 调 试 


测试 程序 是 一 件 不 容易 的 事情 ， 本 章 中 的 函数 相对 容易 测 ， 即 便 如 此 ， 要 选择 一 组 可 以 
测试 所 有 可 能 发 送 的 错误 的 测试 用 例 也 很 困难 ， 从 某 种 程度 上 说 是 不 可 能 的 , 可 以 尽 可 能 履 盖 
错误 ， 但 不 能 完全 杜绝 。 

测试 可 以 帮助 我 们 发 现 bug， 但 生成 一 组 好 的 测试 用 例 并 不 容易 ， 即 使 有 好 的 测试 用 例 ， 
也 不 能 确定 程序 完全 正确 。 

引用 一 个 传奇 计算 机 科学 家 Edsger W.Dijkstra 的 话 : 

程序 测试 可 以 用 例 显示 bug 的 存在 , 但 无 法 显示 它们 的 缺席 ! ( Program testing can be used 


to show the presence of bugs, but never to show their absence! ) 


10.7 温 故 知 新 ， 学 以 致 用 


本 章 主要 讲述 了 日 期 和 时 间 的 相关 知识 ， 在 本 章 结 束 前 回顾 一 下 学 到 的 知识 。 
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(1) 在 Python 中 ， 通 常用 哪 3 种 方式 表示 时 间 ? 
(2) time 模块 有 哪些 常用 方法 ， 都 怎么 使 用 ? 
(3) datetime 模块 有 哪些 常用 方法 ， 都 怎么 使 用 ? 
尝试 思考 并 解决 如 下 问题 : 
自 定义 一 个 函数 ， 该 函数 功能 为 : 
(1) 输入 一 个 字符 (如 lastweek) ， 输 出 上 周一 的 日 期 和 本 周一 的 日 期 时 间 ， 时 间 以 0 
时 0 分 0 秒 计 (如 2016-09-19 00:00:00- 2016-09-26 00:00:00) 。 
(2) 输入 两 个 字符 (如 pastlday、perlhour) ， 和 输出 从 昨天 凌晨 0 点 到 今天 凌晨 0 点 24 
小 时 内 整 点 的 时 间 戳 〈2016-09-25 00:00:00~2016-09-25 01:00:00 的 时 间 戳 ) 。 
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人 全 正则 表达 式 


正则 表达 式 是 处 理 字符 串 强大 的 工具 , 拥有 独特 的 语法 
和 独立 的 处 理 引 擎 ， 效 率 可 能 不 如 str 自 带 的 方法 ， 但 功能 
十 分 强大 。 本 章 我 们 将 学 习 正 则 表达 式 的 基本 使 用 。 





”Ar 
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11.1 认识 正则 表达 式 





正则 表达 式 是 一 个 特殊 字符 序列 ， 能 帮助 用 户 检查 一 个 字符 串 是 否 与 某 种 模式 匹配 ， 从 
而 达成 快速 检索 或 蔡 换 符合 某 个 模式 、 规 则 的 文本 。 例 如， 可 以 在 文档 中 使 用 一 个 正则 表达 式 
表示 特定 文字 ， 然 后 将 其 全 部 删除 或 替换 成 别 的 文字 。 

Python 自 1.5 版 本 起 增加 了 re 模块 , 它 提供 了 Perl 风格 的 正则 表达 式 模式 ,re 模块 使 Python 
语言 拥有 全 部 的 正则 表达 式 功能 。compile 函数 根据 一 个 模式 字符 串 和 可 选 的 标志 参数 生成 一 
个 正则 表达 式 对 象 ， 该 对 象 拥有 一 系列 方法 用 于 正则 表达 式 匹配 和 蔡 换 。 

re 模块 提供 与 compile 的 函数 功能 完全 一 致 的 函数 , 这 些 函数 使 用 模式 字符 串 作 为 第 一 个 
参数 。 
字符 串 是 编程 时 涉及 最 多 的 数据 结构 ， 对 字符 串 操作 的 需求 几乎 无 处 不 在 。 

在 开始 后 续 介 绍 前 ,我 们 先 看 表 11-1 和 表 11-2。 表 11-1 展示 了 一 些 特 殊 字 符 在 正则 表达 
式 中 的 独特 应 用 ， 表 11-2 展示 某 些 字符 类 在 正则 表达 式 中 的 应 用 。 


表 11-1 ”特殊 字符 类 在 正则 表达 式 中 的 应 用 











实例 描述 
匹配 除 "m" 之 外 的 任何 单个 字符 。 要 匹配 包括 "m' 在 内 的 任意 字符 ， 请 使 用 如 '[\n 的 模式 
Yd 匹配 一 个 数字 字符 ， 等 价 于 [0-9] 
VD 匹配 一 个 非 数字 字符 ， 等 价 于 [^0-9] 
's 匹配 任意 空白 字符 ， 包 括 空格 、 制 表 符 、 换 页 符 等， 等 价 于 [\fmntvv] 
\S 匹配 任意 非 空白 字符 ， 等 价 于 [^ nwtv]。 
Ww 匹配 包括 下 划 线 的 任意 单词 字符 ， 等 价 于 [A-Za-z0-9 ] 
WwW 匹配 任意 非 单词 字符 ， 等 价 于 '[^A-Za-z0-9 了 


表 11-2 字符 类 在 正则 表达 式 中 的 应 用 





























实例 描述 
Pp]ython 匹配 "Python" 或 "python" 
rub[ye] 匹配 "ruby" 或 "rube" 
aeiou] 匹配 中 括号 内 的 任意 一 个 字母 
0-9] 匹配 任意 数字 ， 类 似 于 [0123456789] 
a-z] 匹配 任意 小 写字 母 
A-Z] 匹配 任意 大 写字 母 
a-zA-Z0-9] “| 匹配 任意 字母 及 数字 
^aeiou] 除了 aeiou 字母 以 外 的 所 有 字符 
^0-9] 匹配 除了 数字 外 的 字符 
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通过 表 11-1 和 表 11-2 可 以 看 到 ， 一 些 特殊 字符 虽然 很 简短 ， 但 功能 非常 强大 。 下 面 介绍 
一 些 更 详尽 的 正则 表达 式 的 使 用 方式 。 

例如 ,我 们 要 判断 一 个 字符 串 是 否 是 合法 的 Email 地 址 ， 可 以 用 编程 的 方式 提取 @ 前 后 的 
子 串 ， 再 分 别 判 断 是 否 是 单词 和 域名 。 不 过 这 样 做 不 但 需要 写 一 堆 麻烦 的 代码 ,而且 写 出 来 的 
代码 难以 重复 使 用 ， 面 对 不 同 的 需求 可 能 需要 使 用 不 同 的 代码 实现 。 
正则 表达 式 是 匹配 字符 串 的 强 有 力 的 武器 。 正 则 表达 式 的 设计 思想 是 用 描述 性 语言 为 字 
符 串 定义 一 个 规则 ， 凡 是 符合 规则 的 字符 串 ， 我 们 就 认为 “匹配 ”， 和 否则 就 不 匹配 。 正 则 表达 
式 的 大 致 匹配 过 程 是 : 依次 拿 出 表达 式 和 文本 中 的 字符 比较 , 如 果 每 一 个 字符 都 能 匹配 ,匹配 
就 成 功 ， 一 旦 有 匹配 不 成 功 的 字符 ， 匹 配 就 失败 。 

用 正则 表达 式 判 断 一 个 字符 串 是 否 是 合法 的 Email 的 方法 是 : 


(1) 创建 一 个 匹配 Email 的 正则 表达 式 。 
(2) 用 该 正则 表达 式 匹配 用 户 的 输入 从 而 判断 是 否 合法 。 


下 面 我 们 介绍 如 何 使 用 正则 表达 式 描 述 字符 。 
在 正则 表达 式 中 ， 如 果 直 接 给 出 字符 ， 就 是 精确 匹配 。 从 表 11-1 可 知 ， 用 \d 可 以 匹配 一 
个 数字 ， 用 \w 可 以 匹配 一 个 字母 或 数字 ， 例 如 : 
'00\d' 可 以 匹配 (007'"， 但 无 法 匹配 '00q'。 
Nd\d\d' 可 以 匹配 '123'。 
NwWw\d' 可 以 匹配 py3'。 
.可 以 匹配 任意 字符 ， 所 以 'py,' 可 以 匹配 'pyc''pyo' 'py!' 等 。 


在 正则 表达 式 中 ， 要 匹配 变 长 的 字符 ， 用 * 表 示 任 意 个 数 的 字符 (包括 0 个 ) ， 用 + 表示 
至 少 一 个 字符 ， 用 ?表示 0 个 或 1 个 字符 ， 用 {fn} 表示 n 个 字符 ， 用 {n,m} 表 示 n~m 个 字符 。 
下 面 我 们 看 一 个 更 复杂 的 例子 ，\df3}s+\df3,8}。 该 字符 串 从 左 到 右 解 读 如 下 : 


\d{3} 表 示 匹 配 3 个 数字 ， 如 '010'; \ 可 以 匹配 一 个 空格 (包括 Tab 等 空白 符 ) ， 所 以 \s+ 
表示 至 少 有 一 个 空格 ， 如 匹配 ''`、' 等; \d{3,8} 表 示 3~8 个 数字 ， 如 '1234567'。 


综 上 所 述 ， 正 则 表达 式 可 以 匹配 以 任意 个 数 的 空格 隔 开 的 带 区 号 的 电话 号 码 。 
如 果 要 匹配 '010-12345' 这 样 的 号 码 呢 ? 由 于 '-' 是 特殊 字符 ， 在 正则 表达 式 中 要 用 上 转 义 ， 
因此 用 正则 表达 式 表 示 为 \d{3}\-\d{3,8}。 
我 们 前 面 讨论 了 正则 表达 式 的 基本 使 用 方法 , 不 过 如 果 需 要 匹配 带 有 字符 串 的 字符 串 (如 
'010 - 12345') ， 使 用 前 面 的 方式 就 做 不 到 了 ， 在 此 我 们 继续 讨论 一 些 更 复杂 的 匹配 方式 。 
要 更 精确 地 匹配 ， 可 以 用 [表示 范围 ， 例 如 : 
ee [0-9a-zA-Z\ ] 用 以 匹配 数字 、 字 母 或 下 划 线 ， 这 种 方式 可 以 在 一 些 场所 做 输入 值 或 命名 的 合 
ee [0-9a-zA-Z\ ]+ 可 以 匹配 至 少 由 一 个 数字 、 字 母 或 下 划 线 组 成 的 字符 串 , 如 'a100''0_Z' 'Py3000'。 
这 种 方式 可 以 校 验 一 个 字符 串 是 否 包含 数字 、 字 母 或 下 划 线 。 
e@”[a-zA-Z\ ][0-9a-zA-Z\ ]* 可 以 匹配 由 字母 或 下 划 线 开头 ， 后 接任 意 个 数字 、 字 母 或 下 划 线 组 成 
的 字符 串 ， 也 就 是 Python 的 合法 变量 。 
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@ “[a-zA-Z\ ][0-9a-zA-Z\ ]{0, 19} 更 精确 地 限制 了 变量 的 长 度 是 1~20 个 字符 ( 前面 1 个 字符 + 后 
面 最 多 19 个 字符 )。 

”AlB 用 于 匹配 A 或 B， 如 (Plp) ython 可 以 匹配 Python' 或 'python'。 

@ _ ^ 表 示 行 的 开头 ，AAd 表示 必须 以 数字 开头 。 

@ 8$ 表 示 行 的 结束 ，\d$ 表 示 必 须 以 数字 结束 。 


这 里 提供 了 正则 表达 式 更 高 级 的 使 用 ， 正 则 表达 式 更 多 匹配 模式 可 以 查看 附录 A 的 A.7。 








11.2 re 模块 


经 过 前 面 的 知识 储备 ,我 们 可 以 在 Python 中 使 用 正则 表达 式 了 。Python 通过 re 模块 提供 


对 正则 表达 式 的 支持 。 


11.2.1 ”re.match 函数 


- 般 使 用 re 的 步骤 是 先 将 正则 表达 式 的 字符 串 形式 编译 为 Pattern 实例 , 然后 使 用 Pattern 
实例 处 理 文本 并 获得 匹配 结果 (一 个 match 函数 ) ， 最 后 使 用 match 函数 获得 信息 ， 进 行 其 他 


操作 。 


re.match 函数 尝试 从 字符 串 的 起 始 位 置 匹配 一 个 模式 ， 该 函数 语法 如 下 


re.match(pattern, string, flags=0) 
函数 参数 说 明 : pattern 指 匹配 的 正则 表达 式 ; string 指 要 匹配 的 字符 串 ，flags 为 标志 位 ， 


用 于 控制 正则 表达 式 的 


匹配 方式 ， 如 是 否 区 分 大 小 写 、 多 行 匹 配 等 。 





如 果 匹 配 成 功 ，re.match 方法 就 返回 一 个 匹配 的 对 象 ， 否 则 返回 None。 


例如 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


import re 


print(re.match('hello', 'hello world).span0) # 在 起 始 位 置 匹配 


print(re.match('world', " 


执行 结果 如 下 : 


(0, 5) 
None 


hello world)) # 不 在 起 始 位 置 匹配 


11.2.2 re.search 方法 


在 re 模块 中 ， 除 了 match 函数 外 ，search 方法 也 经 常 使 用 。 
re.search 方法 用 于 扫描 整个 字符 串 并 返回 第 一 个 成 功 匹 配 的 字符 ， 语 法 如 下 : 
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re.search(pattern, string, flags=0) 


函数 参数 说 明 : pattern 指 匹配 的 正则 表达 式 ; string 指 要 匹配 的 字符 串 ; flags 为 标志 位 ， 
用 于 控制 正则 表达 式 的 匹配 方式 ， 如 是 否 区 分 大 小 写 、 多 行 匹配 等 。 

如 果 匹 配 成 功 ，re.search 方法 就 返回 一 个 匹配 的 对 象 ， 和 否则 返回 None。 

例如 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 





import re 


print(re.search('hello', 'hello world").span()) # 在 起 始 位 置 匹配 
print(re.search('world', 'hello world).span0) # 不 在 起 始 位 置 匹配 


执行 结果 如 下 : 


(0, 5) 
(6, 11) 


11.2.3 re.match 与 re.search 的 区 别 


re.match 函数 只 匹配 字符 串 开 始 的 字符 ， 如 果 开 始 的 字符 不 符合 正则 表达 式 ， 匹 配 就 会 失 
败 ， 函 数 返回 None。 
re.search 方法 匹配 整个 字符 串 ， 直 到 找到 一 个 匹配 的 对 象 , 匹配 结束 没 找到 匹配 值 才 返 回 
None。 
例如 : 
#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 
import re 
line = 'Cats are smarter than dogs' 
matchObj = re.match(r dogs', line, re.M | re.D) 
if matchObj: 
print(use match,the match string is: ', matchObj.groupO) 
else: 
print("No match stringl 
matchObj = re.search( rdogs', line, re.M |re.D 
if matchObj: 
print(use search,the match string is: ', matchObj.group()) 
else: 


Print("No match string!!") 
执行 结果 如 下 : 
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返 
返 


No match string!! 
use search,the match string is: dogs 


该 示例 使 用 了 match 类 中 的 分 组 方法 一 一 group 方法 。 该 方法 定义 如 下 : 


def group(self, *args): 


group([group1，…]): 获得 一 个 或 多 个 分 组 截获 的 字符 串 ， 指 定 多 个 参数 时 以 元 组 的 形式 
回 。groupl 可 以 使 用 编号 ， 也 可 以 使 用 别名 。 编 号 0 代表 整个 匹配 的 子 串 。 不 填写 参数 时 ， 








回 group(0)， 没 有 截获 字符 串 的 组 时 ， 返 回 None; 截获 多 次 字符 串 的 组 时 ， 返 回 最 后 一 次 











截获 的 子 串 。 


还 有 一 个 常用 的 分 组 方法 groups。 
groups([default]): 以 元 组 形式 返回 全 部 分 组 截获 的 字符 串 ， 相 当 于 调用 group(1,2,…last)。 


default 表示 没有 截获 字符 串 的 组 以 这 个 值 代替 ， 默 认为 None。 


11.3 ” 贪 林 模式 和 非 贪 禁 模 式 


正则 表达 式 通常 使 用 于 查找 匹配 的 字符 串 。Python 里 数量 词 默 认 是 贫 禁 的 〈 在 少数 语言 


里 也 可 能 默认 非 贪 焚 ) ， 总 是 尝试 匹配 尽 可 能 多 的 字符 ; 非 贪 楚 模式 正好 相反 ， 总 是 尝试 匹配 


尽 





可 能 少 的 字符 。 
例如 ， 正 则 表达 式 "aby" 如 果 用 于 查找 "abbbe"， 就 会 找到 "abbb"。 如 果 使 用 非 贫 禁 的 数量 


词 "ab*?"， 就 会 找到 "a"。 


例如 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


print(re.match(r^(\d+X0*)$', '102300").groups()) 

执行 结果 为 : 

(102300, ") 

由 于 \d+ 采 用 贪 禁 匹配 ， 直 接 把 后 面 的 0 全 部 匹配 了 , 结果 0* 只 能 匹配 空 字符 串 。 要 让 0* 


能 够 匹配 到 后 面 的 两 个 0， 必 须 让 \d+ 采 用 非 贪 禁 匹 配 〈 尽 可 能 少 匹 配 ) 。 在 0* 后 面 加 一 个 ? 


就 


可 以 让 \d+ 采 用 非 贪 禁 匹 配 。 具 体 实现 如 下 : 


#! /usr/bin/python3 
# -*- coding:UTF-8 -*- 


print(re.match(r^(\d+?)(0*)$', '102300").groups()) 
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执行 结果 为 : 


(1023', '00') 


11.4 替换 


Python 的 re 模块 提供 了 re.sub， 用 于 替换 字符 串 中 的 匹配 项 。 

sub(repl, string[, count]) | re.sub(pattern, repl, string[, count]): 使 用 repl 替换 string 中 每 一 个 
匹配 的 子 串 后 返回 替换 后 的 字符 串 。 当 repl 是 一 个 方法 时 ， 这 个 方法 应 当 只 接收 一 个 参数 

(match 对 象 ) ， 并 返回 一 个 字符 串 用 于 替换 (返回 的 字符 串 中 不 能 再 引用 分 组 ) 。count 用 

于 指定 最 多 替换 次 数 ， 不 指定 时 全 部 蔡 换 。 

例如 : 

#! /usr/bin/python3 

#-*- coding:UTF-8 -二 

pt= Te.compile(r'(w+) (w+)') 

greeting = "i say, hello world!' 


print(pt.sub(r'2 1', greeting)) 


def func(m): 
return m.group(l).title(O+' +m.group(2).title() 
Print(pt.sub(func, greeting)) 
执行 结果 为 : 
i say, hello world! 
i say, hello world! 


11.5 编译 


当 我 们 在 Python 中 使 用 正则 表达 式 时 ，re 模块 内 部 会 做 两 件 事情 : 

(1) 编译 正则 表达 式 ， 如 果 正 则 表达 式 的 字符 串 本 身 不 合法 ， 就 会 报错 。 

(2) 用 编译 后 的 正则 表达 式 匹配 字符 串 。 

如 果 一 个 正则 表达 式 需 要 重复 使 用 几 千 次 ， 出 于 效率 的 考虑 ， 我 们 可 以 预 编译 该 正则 表 
达 式 ， 这 样 重复 使 用 时 就 不 需要 编译 这 个 步骤 了 ， 直 接 匹配 即 可 ， 例 如 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 





02250 





正则 表达 式 第 省 党 





re_telephone = re.compile(r^(\d{3})-(\d{3,8))5") 
print(re_telephone.match('010-12345").groups()) 
print(re_telephone.match('010-8086").groups()) 


执行 结果 为 : 


("010','12345') 
("010', '8086') 


11.6 温 故 知 新 ， 学 以 致 用 





正则 表达 式 非常 强大 ， 本 章 主 要 讲述 了 正则 表达 式 的 基本 知识 ， 如 果 你 经 常 遇 到 正则 表 
达 式 的 问题 ， 或 者 想 更 深入 地 学 习 ， 建 议 自 备 一 本 正则 表达 式 的 参考 书 。 
在 本 章 结束 前 回顾 一 下 学 习 到 的 概念 。 
(1) 什么 是 正则 表达 式 ? 
(2) re 模块 中 的 match 函数 和 search 方法 怎么 使 用 ， 两 者 的 区 别 是 什么 ? 
(3) 什么 叫 贪 禁 模式 和 非 贪 禁 模 式 ? 
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AAA 文件 操作 


我 们 目前 的 操作 都 是 很 直观 地 执行 程序 ， 要 么 是 在 交互 
模式 下 执行 , 要 么 是 执行 py 文件 , 还 没有 涉及 对 文件 的 操作 。 

运行 程序 时 ， 用 变量 保存 数据 是 一 个 比较 通用 的 方法 。 
如 果 希 望 程序 结束 后 数据 仍然 能 够 保存 , 就 不 能 使 用 变量 保 
存 数据 了 , 需要 寻找 其 他 方式 保存 数据 , 文件 就 是 一 个 不 错 
的 选择 。 在 程序 运行 过 程 中 将 数据 保存 到 文件 中 ,程序 运行 
结束 后 ， 相 关 数 据 就 保存 到 文件 中 了 。 当 然 ， 这 涉及 对 文件 
的 操作 。 

通过 本 章 的 学 习 ， 读 者 将 了 解 如 何 使 用 Python 在 硬盘 
上 创建 、 读 取 和 保存 文件 。 
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文件 操作 第 12 党 





12.1 打开 文件 


在 Python 中 ， 打 开 文 件 使 用 的 是 open 函数 。open 函数 的 基本 语法 如 下 : 

open(file name [, access_mode][,buffering]) 
【参数 解析 】 

@ file name 变量 : 是 一 个 包含 要 访问 的 文件 名 称 的 字符 串 值 。 

@ access_ mode 变量 : 指 打开 文件 的 模式 ， 对 应 有 只 读 、 写 入 、 追 加 等 。access mode 变量 值 不 
是 必需 的 ( 不 带 access_ mode 变量 时 ， 要 求 file name 存在 ， 否 则 报 异常 )， 默 认 的 文件 访问 
模式 为 只 读 (T)。 

@ buffering: 如 果 buffering 的 值 被 设 为 0， 就 不 会 有 寄存 ; 如 果 buffering 的 值 取 1， 访 问 文件 
时 就 会 寄存 行 ; 如 果 将 buffering 的 值 设 为 大 于 1 的 整数 ， 表 示 这 就 是 寄存 区 的 缓冲 大 小 ; 如 
果 取 负 值 ， 寄 存 区 的 缓冲 大 小 就 是 系统 默认 的 值 。 


open 函数 返回 一 个 File (文件 ) 对 象 。File 对 象 代 表 计算 机 中 的 一 个 文件 ， 是 Python 中 
另 一 种 类 型 的 值 ， 就 像 我 们 熟悉 的 列表 和 字典 。 

例如 : 

#! /usr/bin/python 

#-*-coding:UTF-8-*- 


path = "d:/test.txt' 
f_name = open(path) 
print(f_ name.name) 


执行 结果 如 下 : 

d:/test.txt 

执行 结果 告诉 我 们 打开 的 是 d 盘 下 的 test.txt 文件 (执行 该 程序 前 ， 已 经 创建 了 一 个 名 为 

test.txt 的 文件 ) 。 

这 里 有 几 个 概念 要 先 弄 清楚 。 

@ 文件 路 径 : 在 该 程序 中 ， 我 们 先 定 义 了 一 个 path 变量， 变量 值 是 一 个 文件 的 路 径 。 文 件 的 路 
径 是 指 文件 在 计算 机 上 的 位 置 ， 如 该 程序 中 的 d:/test.txt 是 指 文件 在 d 盘 、 文 件 名 为 test.txt。 
文件 路 径 又 分 为 绝对 路 径 和 相对 路 径 。 

> 绝对 路 径 : 总 是 从 根 文件 夹 开始 。 比 如 在 Windows 环境 下 ， 一 般 从 c 盘 、d 盘 等 开始 ，c 
盘 、d 盘 被 称 为 根 文件 天 ， 在 该 盘 中 的 文件 都 得 从 根 文件 夹 开始 往 下 一 级 一 级 查找 。 在 
Linux 环境 下 ， 一 般 从 usr、home 等 根 文件 开始 。 比 如 在 上 面 的 示例 程序 中 ，path 变量 值 
就 是 一 个 绝对 路 径 ， 在 文件 搜索 框 中 输入 绝对 路 径 可 以 直接 找到 该 文件 。 
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> 相对 路 径 : 相对 于 程序 当前 工作 目录 的 路 径 。 比 如 当前 工作 文件 存放 的 绝对 路 径 是 
D:\pythonvworkspace， 如 果 使 用 相对 路 径 ， 就 可 以 不 写 这 个 路 径 ， 用 一 个 “.” 号 代替 这 个 
路 径 值 。 
例如 : 


#! /usr/bin/python 
# -*-coding:UTF-8-*- 


path = "testtxt' 


f name = open(path, 'w') 

Print(f_name.name) 

执行 结果 如 下 : 

/test.txt 

执行 完 程序 后 ， 到 D:\python\workspace 路 径 下 查看 ， 可 以 看 到 创建 了 一 个 名 为 test.txt 的 
文件 。 

除了 单个 点 〈.) ， 还 可 以 使 用 两 个 点 〈..) 表示 父 文件 夹 〈 或 上 一 级 文件 夹 ) 。 此 处 不 具 
体 讨 论 ， 有 兴趣 可 以 自己 尝试 。 


12.1.1 文件 模式 


我 们 在 前 面 讲 到 , 使 用 open 函数 时 可 以 选择 是 否 传 入 mode 参数 。 在 前 面 的 示例 中 , mode 
传 入 了 一 个 值 为 w 的 参数 , 这 个 参数 是 什么 意思 呢 ? mode 可 以 传 入 哪些 值 呢 ? 具体 信息 如 表 
12-1 所 示 。 














表 12-1 文件 模式 

模式 描述 
r 以 只 读 方 式 打开 文件 。 文 件 的 指针 将 会 放 在 文件 的 开头 ， 这 是 默认 模式 
Tb 以 二 进 制 格式 打开 一 个 文件 用 于 只 读 。 文 件 指针 将 会 放 在 文件 的 开头 ， 这 是 默认 模式 
TI 打开 一 个 文件 用 于 读 写 。 文 件 指针 将 会 放 在 文件 的 开头 
Tb+ 以 二 进 制 格式 打开 一 个 文件 用 于 读 写 。 文 件 指针 将 会 放 在 文件 的 开头 

WwW 打开 一 个 文件 只 用 于 写 入 。 如 果 该 文件 已 存在 ， 就 将 其 覆盖 ， 如 果 该 文件 不 存在 ， 就 创建 新 文件 

以 二 进 制 格式 打开 一 个 文件 只 用 于 写 入 。 如 果 该 文件 已 存在 ， 就 将 其 覆盖 ; 如 果 该 文件 不 存在 ， 就 


创建 新 文件 

wt 打开 一 个 文件 用 于 读 写 。 如 果 该 文件 已 存在 ， 就 将 其 覆盖 ， 如果 该 文件 不 存在 ， 就 创建 新 文件 
以 二 进 制 格式 打开 一 个 文件 用 于 读 写 。 如 果 该 文件 已 存在 ， 就 将 其 覆盖 ;如 果 该 文件 不 存在 ， 就 创 
建新 文件 

打开 一 个 文件 用 于 追加 。 如 果 该 文件 已 存在 ， 文 件 指针 就 会 放 在 文件 的 结尾 。 也 就 是 说 ， 新 内 容 将 
会 被 写 入 已 有 内 容 之 后 。 如 果 该 文件 不 存在 ， 就 创建 新 文件 进行 写 入 
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( 续 表 ) 
模式 描述 

过 以 二 进 制 格式 打开 一 个 文件 用 于 追加 。 如 果 该 文件 已 存在 , 文件 指针 就 会 放 在 文件 结尾 。 也 就 是 说 ， 
新 内 容 将 会 被 写 入 已 有 内 容 之 后 。 如 果 该 文件 不 存在 ， 就 创建 新 文件 进行 写 入 

打开 一 个 文件 用 于 读 写 。 如 果 该 文件 已 存在 ， 文 件 指针 就 会 放 在 文件 的 结尾 。 文 件 打 开 时 是 追加 模 
式 。 如 果 该 文件 不 存在 ， 创 建新 文件 就 用 于 读 写 

以 二 进 制 格式 打开 一 个 文件 用 于 追加 。 如 果 该 文件 已 存在 ， 文 件 指针 将 会 放 在 文件 结尾 ; 如 果 该 文 
件 不 存在 ， 创 建新 文件 就 用 于 读 写 





使 用 open 函数 时 ， 明 确 指 定 读 模式 和 什么 模式 都 不 指定 的 效果 是 一 样 的 ， 我 们 在 前 面 的 
示例 已 经 验证 。 

使 用 写 模 式 可 以 向 文件 写 入 内 容 。+ 参 数 可 以 用 到 其 他 任何 模式 中 ， 指 明 读 和 写 都 是 允许 
的 。 比 如 w+ 可 以 在 打开 一 个 文件 时 用 于 文件 的 读 写 。 

当 参 数 带 上 字母 b 时 ， 表 示 可 以 用 来 读 取 一 个 二 进 制 文件 。Python 在 一 般 情况 下 处 理 的 
都 是 文本 文件 ， 有 时 也 不 能 避免 处 理 其 他 文件 格式 的 文件 。 


12.1.2 ”缓冲 


open 函数 的 第 3 个 参数 是 可 选择 的 , 该 参数 控制 文件 的 缓存 .如 果 该 参数 赋值 为 0 或 False， 
1/O 输 入/ 输出) 就 是 无 缓存 的 。 如 果 是 1 或 True，IO 就 是 有 缓存 的 。 大 于 1 的 整数 代表 组 
存 的 大 小 (单位 是 字 节 ) ，-1 或 小 于 0 的 整数 代表 使 用 默认 的 缓存 大 小 。 

读者 可 能 对 缓存 和 IO 有 些 不 明白 。 缓 存 一 般 指 的 是 内 存 ， 计 算 机 从 内 存 中 读 取 数据 的 速 
度 远 远大 于 从 磁盘 读 取 数据 的 速度 ， 一 般 内 存 大 小 远 小 于 磁盘 大 小 , 内 存 的 速度 比较 快 ,但 资 
源 比较 紧张 ， 所 以 这 里 有 是 否 对 数据 进行 缓存 的 设置 。 

IO 在 计算 机 中 指 Input/Output， 也 就 是 输入 和 输出 。 由 于 程序 和 运行 时 数据 在 内 存 中 驻 
留 ， 由 CPU 这 个 超 快 的 计算 核心 执行 ， 涉 及 数据 交换 的 地 方 通常 是 磁盘 、 网 络 等 ， 因 此 需要 
IO 接口 。 

比如 打开 浏览 器 , 访问 百度 首页 浏览 器 需要 通过 网 络 IO 获取 百度 网 页 。 浏览 器 首先 会 
发 送 数 据 给 百度 服务 器 ， 告 诉 它 我 想 要 首页 的 HTML， 这 个 动作 是 往外 发 数据 ， 叫 Output; 
随后 百度 服务 器 把 网 页 发 过 来 ， 这 个 动作 是 从 外 面 接收 数据 ， 叫 Input。 通 常 ， 程 序 完 成 IO 
操作 会 有 Input 和 Output 两 个 数据 流 。 当 然 也 有 只 用 一 个 数据 流 的 情况 ， 比 如 从 磁盘 读 取 文件 
到 内 存 ， 只 有 Input 操作 ;， 反 过 来 ， 把 数据 写 到 磁盘 文件 里 ， 只 有 Output 操作 。 


12.2 基本 文件 方法 


12.1 节 介 绍 了 打开 文件 的 open 函数 ， 也 做 了 一 些 简单 操作 ， 接 下 来 介绍 一 些 基 本 文件 方 
法 。 在 开始 介绍 之 前 ， 首 先 需要 了 解 一 下 流 的 概念 。 

IO 编程 中 ，Stream 〈 流 ) 是 一 个 很 重要 的 概念 。 可 以 把 流 想象 成 一 个 水 管 ， 数 据 就 是 水 
管 里 的 水 , 但 是 只 能 单 向 流动 。Input Stream 就 是 数据 从 外 面 (磁盘 、 网 络 ) 流 进 内 存 ，Output 
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Stream 就 是 数据 从 内 存 流 到 外 面 去 。 浏 览 网 页 时 ， 浏 览 器 和 服务 器 之 间 至 少 需要 建立 两 根 水 
管 ， 才 能 既 发 送 数据 又 接收 数据 。 


12.2.1 ” 读 和 写 


open 函数 返回 的 是 一 个 File 对 象 ， 有 了 File 对 象 ， 就 可 以 开始 读 取 内 容 。 如 果 希 望 将 整 
个 文件 的 内 容 读 取 为 一 个 字符 串 值 ， 可 以 使 用 File 对 象 的 read() 方 法 。 

Read() 方 法 从 一 个 打开 的 文件 中 读 取 字 符 串 。 需 要 注意 , Python 字符 串 可 以 是 二 进 制 数据 ， 
而 不 是 仅仅 是 文字 。 语 法 如 下 : 

fileObject.read([count]); 

fileObject 为 open 函数 返回 的 File 对 象 , count 参数 是 从 已 打开 的 文件 中 读 取 的 字 节 计数 。 
该 方法 从 文件 的 开头 开始 读 入 ， 如 果 没 有 传 入 count， 就 会 尝试 尽 可 能 多 地 读 取 内 容 ， 很 可 能 

- 直 读 取 到 文件 末尾 。 
比如 我 们 在 test.txt 文件 中 写 入 “Hello world!Welcome!”， 执 行 如 下 代码 : 


#! /usr/bin/python 
# -#-coding:UTF-8-*#- 


path = "test.txt' 


f_ name = open(path,'r'’) 
Print(read result:', f_name.read(12)) 


执行 结果 如 下 : 

read result: Hello world! 

由 执行 结果 看 到 ， 通 过 read 方法 我 们 读 取 了 文件 中 从 头 开始 的 12 个 字符 串 。 

将 print('read result:, f name.read(12)) 更 改 为 print('read result:, f name.read())， 得 到 的 执行 
结果 如 下 : 

read result: Hello world! Welcome! 

由 执行 结果 看 到 ， 没 有 指定 读 取 字 节 数 时 ，read 方法 会 读 取 打开 文件 中 的 所 有 字 节 。 

除了 读 取 数据 外 ， 我 们 还 可 以 向 文件 中 写 入 数据 。 在 Python 中 ， 将 内 容 写 入 文件 的 方式 
与 print 函数 将 字符 串 输出 到 屏幕 上 类 似 。 

如 果 打 开 文 件 时 使 用 读 模 式 ， 就 不 能 写 入 文件 ， 即 不 能 用 下 面 这 种 形式 操作 文件 : 

open(path, rw) 

在 Python 中 ， 用 write() 方 法 向 一 个 文件 写 入 数据 。write() 方 法 可 将 任何 字符 串 写 入 一 个 
打开 的 文件 。 需 要 注意 ，Python 字符 串 可 以 是 二 进 制 数据 ， 而 不 是 仅仅 是 文字 。 

write() 方 法 不 会 在 字符 串 结尾 添加 换行 符 (\n)， 语 法 如 下 : 


fileObject.write(string); 
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fileObject 为 open 函数 返回 的 File 对 象 ，string 参数 是 需要 写 入 文件 中 的 内 容 。 
该 方法 返回 写 入 文件 的 字符 串 的 长 度 。 
例如 : 


#! /usr/bin/python 
# -*-coding:UTF-8-*- 





path = "testtxt' 


f_ name = open(path, 'w') 
Pprint('write length:', f name.write('Hello world!')) 


执行 结果 如 下 : 
write length: 12 
由 执行 结果 看 到 ， 我们 向 test.txt 文件 中 写 入 了 12 个 字符 。 下 面 验证 一 下 写 入 的 是 否 是 我 


们 指定 的 字符 ， 在 上 面 的 程序 中 追加 两 行 代码 并 执行 : 


f name = open(pathvr) 
Print(read result:', f_name.read()) 


执行 结果 如 下 : 


write length: 12 
read result: Hello world! 


由 执行 结果 看 到 ， 写 入 文件 的 是 我 们 指定 的 内 容 。 不 过 这 里 有 一 个 疑问 ， 我 们 在 这 里 执 


行 了 两 次 写 入 操作 ， 得 到 的 结果 怎么 只 写 入 了 一 次 ? 


写 文件 (write) 方法 的 处 理 方 式 是 : 将 覆 写 原 有 文件 ， 从 头 开 始 ， 每 次 写 入 都 会 覆盖 前 


面 所 有 内 容 ， 就 像 用 一 个 新 值 覆盖 一 个 变量 的 值 。 若 需要 在 当前 文件 的 字符 串 后 追加 字符 , 该 
怎么 办 呢 ? 


可 以 将 第 二 个 参数 w 更 换 为 a， 即 以 追加 模式 打开 文件 ， 例 如 : 


#! /usr/bin/python 
# -*-coding:UTF-8-*- 


path = 'Vtesttxt' 


ft_ name = open(path, 'w') 

print('write length:', f name.write(Hello world!)) 
f_name = open(path,'r’) 

print(read result:', f_name.read()) 

f_ name = open(path, 'a) 

Pprint(add length:', f_ name.write('‘welcome!')) 


f_name = open(path,'r’) 
print(read result:', f_ name.read()) 
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执行 结果 如 下 : 

write length: 12 

read result: Hello world! 

add length: 8 

read result: Hello world!welcome! 


由 执行 结果 看 到 ， 输 出 结果 在 文件 末尾 成 功 添加 了 对 应 字符 串 。 


如 果 传递 给 open 函数 的 文件 名 不 存在 ， 写 模式 (w ) 和 追加 模式 (a) 就 会 创建 一 个 新 的 空 
注 意 文件 ， 然 后 执行 写 入 或 追加 。 


如 果 想 追加 的 字符 串 在 下 一 行 ， 该 怎么 办 呢 ? 

在 Python 中 ， 用 表示 换行 。 对 于 上 面 的 示例 ， 若 需要 追加 的 内 容 在 下 一 行 ， 可 以 如 下 
操作 : 

f name = open(path, 'w') 

Pprint('write length:', f_ name.write('Hello world!')) 

f_ name = open(path,'r’) 

print('read result:', f_name.read()) 

f_name = open(path, 'a) 

print(add length:', f_name.write('‘welcome!')) 

f_name = open(path,'r'’) 

print('read result:', f_name.read()) 

执行 结果 如 下 : 

write length: 13 

read result: Hello world! 

add length: 8 

read result: Hello world! 

welcome! 


由 执行 结果 看 到 ， 后 面 追加 的 内 容 在 下 一 行 了 。 


C7 若 需要 读 或 写 特定 编码 方式 的 文本 ， 则 需要 给 open 函数 传 入 encoding 参数 ; 若 需要 读 取 
< GBK 编码 的 文件 ， 则 前 面 示例 可 以 改写 为 name = open(path, T', encoding='gbk)， 这 样 读 取 
提 示 到 的 文件 就 是 GBK 编码 方式 的 文件 了 。 
12.2.2” 读 写 行 

我 们 目前 对 文件 的 读 操 作 是 按 字 节 读 或 整个 读 取 ， 而 写 操 作 是 全 部 履 写 或 追加 ， 这 样 的 
操作 在 实际 应 用 中 很 不 实用 。Python 为 我 们 提供 了 readline()、readlines() 和 writelines() 等 方法 
用 于 行 操作 ， 例 如 : 
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这 


#! /usr/bin/python 

# -*#-coding:UTF-8-*#- 

path = "./test.txt' 

f name = open(path, 'w') 

f name.write('Hello world!\n') 

f name = open(path, 'a) 

f_ name.write('welcome!') 

f name = open(path,'r'’) 

print(readline result:', f_ name.readline()) 


执行 结果 为 : 

readline result: Hello world! 

由 执行 结果 得 知 ，readline 方法 会 从 文件 中 读 取 单独 一 行 ， 换 行 符 为 m。readline 方法 如 果 
回 一 个 空 字符 串 ， 说明 已 经 读 取 到 最 后 一 行 了 。 

readline 方法 也 可 以 像 read 方法 一 样 传 入 数值 读 取 对 应 的 字符 数 , 传 入 小 于 0 的 数值 表示 





整 行 都 输出 。 


如 果 将 上 面 示例 的 最 后 一 行 : 
Print(readline result:', f_name.readline()) 

更 改 为 : 

print(readline result:', f_name.readlines()) 
得 到 的 输出 结果 为 : 

readline result: ['Hello world!\n', ‘welcome!'] 


输出 结果 为 一 个 字符 串 的 列表 。 列 表 中 的 每 个 字符 串 就 是 文本 中 的 每 一 行 ， 并 且 换行 符 


也 会 被 输出 。 


readlines 方法 可 以 传 入 数值 参数 ， 当 传 入 的 数值 小 于 等 于 列表 中 一 个 字符 串 的 长 度 值 时 ， 


该 字符 串 会 被 读 取 ， 当 传 入 小 于 等 于 0 的 数值 时 ， 所 有 字符 都 会 被 读 取 。 


例如 : 


#! /usr/bin/python 
#-*-coding:UTF-8-*- 


path = "./test.txt'" 

f_name = open(path, 'w') 

str_list = [Hello world!\n', 'welcome!\n', 'welcome!\n'] 
Print('write length:', f name.writelines(str_list)) 

人 name = open(path,'r’) 

print(read result:', f_ name.read()) 

f_name = open(path,'r’) 

print(readline result:', f_name.readlines()) 
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执行 结果 如 下 : 

write length: None 

read result: Hello world! 
welcome! 


welcome! 
readline result: ['Hello world!\n', 'welcome!\n', 'welcome!\n'] 


由 执行 结果 看 到 ，writelines 方法 和 readlines 方法 相反 ， 传 给 它 一 个 字符 串 列表 任何 序 
列 或 可 秋 代 对 象 ) ， 它 会 把 所 有 字符 串 写 入 文件 。 如 果 没 有 writeline 方法 ， 就 可 以 使 用 write 
方法 代 蔡 这 个 方法 的 功能 。 


12.2.3 ”关闭 文件 


我 们 前 面 介 绍 了 很 多 读 取 和 写 入 文件 的 内 容 ， 都 没有 提 到 在 读 或 写 文件 的 过 程 中 出 现 异 
常 时 该 怎么 处 理 。 在 读 或 写 文件 的 过 程 中 ,出现 异 常 的 概率 还 是 挺 高 的 ,特别 对 于 大 文件 的 读 
取 和 写 入 ， 出 现 异 常 更 是 家 常 便 饭 。 在 读 或 写 文件 的 过 程 中 ， 出 现 异 常 该 怎么 处 理 呢 ? 

这 就 需要 用 到 前 面 介绍 的 异常 的 知识 了 ， 用 try 语句 捕获 可 能 出 现 的 异常 。 在 捕获 异常 前 
有 一 个 动作 要 执行 ， 就 是 使 用 close 方法 关闭 文件 。 

- 般 情 况 下 ， 一 个 文件 对 象 在 退出 程序 后 会 自动 关闭 ， 但 是 为 了 安全 起 见 ， 还 是 要 显 式 
地 写 一 个 close 方法 关闭 文件 。 一 般 显示 关闭 文件 读 或 写 的 操作 如 下 : 

#! /usr/bin/python 

#-*-coding:UTF-8-*- 

path = "./test.txt'" 

f_name = open(path, 'w') 

print('write length:', f_ name.write('Hello world!')) 

f_name.close() 


这 段 代码 和 没有 加 close 方法 的 执行 结果 一 样 。 这 样 处 理 后 的 函数 比 没有 加 close 方法 时 
更 安全 , 可 以 避免 在 某 些 操作 系统 或 设置 中 进行 无 用 的 修改 , 也 可 以 避免 用 完 系统 中 所 打开 文 
件 的 配额 。 

对 内 容 更 改过 的 文件 一 定 要 记得 关闭 ， 因 为 写 入 的 数据 可 能 被 缓存 ， 如 果 程 序 或 系统 因 
为 某 些 原因 而 骨 省 ,被 缓存 部 分 数据 就 不 会 写 入 文件 了 。 为 了 安全 起 见 ， 在 使 用 完 文件 后 一 定 
要 记得 关闭 。 

当 使 用 try 语句 出 现 异常 时 , 即使 使 用 了 close 方法 , 也 可 能 不 被 执行 , 这 时 该 怎么 办 呢 ? 

还 记得 finally 子 句 吗 ? 可 以 将 close 方法 放 在 finally 子 句 中 执行 , 从 而 保证 无 论 程序 执行 
是 否 正常 都 会 调用 close 方法。 上 面 的 示例 可 以 更 改 成 更 安全 的 形式 : 

#! /usr/bin/python 

#-*-coding:UTF-8-*- 





path = 'Vtesttxt' 
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try: 
f name = open(path, 'w') 
print('write length:', f_ name.write('Hello world!)) 
finally: 
iff_ name: 
f name.close() 
如 果 每 次 都 要 这 么 写 ， 就 会 很 烦琐 ， 是 否 有 更 简便 的 方式 处 理 呢 ? 
Python 中 引入 了 with 语句 自动 帮 我 们 调用 close 方法 。 可 以 使 用 with 语句 将 上 面 的 程序 
更 改 为 : 
#! /usr/bin/python 
#-*-coding:UTF-8-*- 


path = "./test.txt' 
with open(path, 'w') asf: 
f name = open(path, 'w') 
print('write length:', f_name.write('Hello world!)) 
这 段 代码 和 上 面 使 用 try/finally 的 效果 一 样 ， 并 且 会 自动 调用 close 方法 ， 不 用 显 式 地 写 
该 方法 。 可 以 发 现 ， 代 码 比 前 面 简洁 多 了 ， 后 面 可 以 多 用 这 种 方式 编写 。 


12.2.4 文件 重 命名 


在 应 用 程序 的 过 程 中 ， 我 们 可 能 需要 程序 帮助 我 们 重 命名 某 个 文件 的 名 字 ， 而 不 是 通过 
手动 的 方式 进行 ， 这 样 是 否 可 以 呢 ? 

Python 的 os 模块 为 我 们 提供 了 rename 方法 ， 即 文件 重 命名 。 使 用 这 个 方法 需要 导入 os 
模块 。rename 方法 的 语法 如 下 : 

os.rename(current file_ name, new_file_name) 

os 为 导入 的 os 模块 ，current_file_name 为 当前 文件 名 ，new_file_name 为 新 文件 名 。 若 文 
件 不 在 当前 目录 下 ， 则 文件 名 需要 带 上 绝对 路 径 。 

该 方法 没有 返回 值 。 

使 用 示例 如 下 : 


#! /usr/bin/python 
#-*-coding:UTF-8-*- 


open('./testl .txt', 'w') 
oOs.rename('test] .txt','test2.txt') 


执行 结果 可 以 到 对 应 目录 下 查看 ， 若 之 前 已 经 创建 了 名 为 testl.txt 的 文件 ， 则 将 文件 名 更 
改 为 test2.txt; 若 之 前 没有 创建 testl.txt 文件 ， 则 先 创建 testl.txt 文件 ， 然 后 将 文件 名 更 改 为 
test2.txt。 
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Python 3.5 从 零 开 始 学 





12.2.5 ”删除 文件 


在 应 用 程序 的 过 程 中 ， 我 们 是 否 可 以 通过 程序 删除 某 个 文件 呢 ? 

Python 的 os 模块 为 我 们 提供 了 remove 方法 ， 即 删除 文件 。 使 用 这 个 方法 需要 导入 os 模 
块 。remove 方法 的 语法 如 下 : 

os.remove(file_name) 

os 为 导入 的 os 模块 ，file_name 为 需要 删除 的 文件 名 。 若 文件 不 在 当前 目录 下 ， 则 文件 名 
需要 使 用 绝对 路 径 。 

该 方法 没有 返回 值 。 

使 用 示例 如 下 : 


#! /usr/bin/python 
#-*-coding:UTF-8-*- 


try: 
print(remove result: os.remove('test2.txt")) 

except Exception: 
print(file not found') 

执行 该 方法 会 把 前 面 的 示例 中 重 命名 的 test2.txt 文件 删除 。 当 然 ， 该 方法 只 能 删除 已 经 存 


在 的 文件 ， 文 件 不 存在 就 会 抛 异常 。 
12.3 ”对 文件 内 容 进 行 迭代 


前 面 介绍 了 文件 的 基本 操作 方法 。 在 实际 应 用 中 ， 对 文件 内 容 进 行 兴 代 和 重复 执行 操作 
是 比较 常见 的 操作 。 

所 谓 迭 代 ， 是 指 不 断 重复 某 一 个 动作 ， 直 到 这 些 动作 都 完成 为 止 。 
12.3.1 ” 按 字 节 处 理 

在 while 循环 中 ，read 方法 是 最 常见 的 对 文件 内 容 进 行 迭 代 的 方法 ， 例 如 


#! /usr/bin/python 
#-*-coding:UTF-8-*- 


path = "./test.txt' 

f_ name = open(path, 'w') 

Print('write length:', f name.write('Hello')) 
f_ name = open(path) 

c_str=f name.read(1) 
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While ¢_str: 
print(read str is:, ¢_str) 
c_str=f name.read(1) 

f name.close() 

执行 结果 如 下 : 

write length: 5 

read str is: H 

read stris: e 

read str is: | 


read strr is: | 
read stris: 0 


由 执行 结果 看 到 ， 该 示例 对 写 入 文件 的 每 个 字符 都 进行 循环 了 。 这 个 程序 运行 到 文件 末 
尾 时 ，read 方法 会 返回 一 个 空 字符 串 ， 未 执行 到 空 字符 串 前 ， 返 回 的 都 是 非 空 字符 ， 表 示 布 尔 
值 为 真 。 

该 示例 中 出 现 了 代码 的 重复 使 用 ， 可 以 使 用 while true/break 语句 结构 进一步 优化 。 优 化 
代码 如 下 : 


f_name = open(path) 
while True: 
c_str=f name.read(1) 
if not ¢_str: 
break 
print(read str is:', c_str) 
f_name.close() 


由 代码 结构 看 到 ， 更 改 后 的 代码 比 之 前 更 好 。 
12.3.2 ” 按 行 操作 


在 实际 操作 中 ， 处 理 文件 时 可 能 需要 对 文件 的 行进 行 办 代 ， 而 不 是 单个 字符 。 此 时 可 以 
使 用 和 处 理 字符 一 样 的 方式 ， 只 不 过 要 使 用 readline 方法 ， 例 如 : 


f_ name = open(path) 
while True: 
line =f name.readline(1) 
if not c_str: 
break 
print(read line is:', line) 


人 name.close() 


使 用 该 方式 得 到 的 是 按 行 读 取 的 字符 。 
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12.3.3 ”使 用 fileinput 实现 懒 加 载 式 迭 代 


我 们 前 面 介绍 过 read 方法 和 readlines 方法 ， 这 两 个 方法 不 带 参数 时 将 读 取 文 件 中 所 有 内 

容 ， 然 后 加 载 到 内 存 中 。 当 文件 很 大 时 ， 使 用 这 种 方式 会 占用 太 多 内 存 ， 甚 至 直接 使 内 存 溢出 
(内 存 不 够 ) ， 从 而 导致 执行 失败 。 这 种 情况 下 ， 我 们 可 以 考虑 使 用 while 循环 和 readline 方 

法 代替 这 些 方法 。 

在 Python 中 , for 循环 是 优先 考虑 的 选择 , 使 用 for 循环 意味 着 可 以 对 任务 进行 分 隔 操作 ， 
而 不 是 一 步 到 位 。 

按 行 读 取 文 件 时 ， 若 能 使 用 for 循环 ， 则 称 之 为 懒 加 载 式 欠 代 ， 因 为 在 操作 过 程 中 只 读 取 
实际 需要 的 文件 部 分 。 使 用 fileinput 需要 导入 fileinput 模块 ， 例 如 : 

#! /usr/bin/python 

# -*-coding:UTF-8-*- 


import fileinput 
for line in fileinput.input(path): 
print('line is:', line) 

在 该 示例 中 没有 看 到 文件 的 打开 与 关闭 操作 ， 是 怎么 处 理 文件 的 呢 ? 其 实 这 些 操作 被 封 
装 在 input 方法 内 部 了 。 
12.3.4 ”文件 迭代 器 

从 Python 2.2 版 本 开始 ， 文 件 对 象 是 可 迭代 的 ， 这 意味 着 可 以 直接 在 for 循环 中 使 用 文件 
对 象 ， 从 而 进行 迭代 ， 例 如 : 

#! /usr/bin/python 


#-*-coding:UTF-8-*- 


f_ name = open(path) 

for line in f name: 
print('line is:', line) 

f_name.close() 


该 示例 使 用 for 循环 对 文件 对 象 进行 迭代 ， 记 住 迭 代 结束 后 要 显 式 关闭 文件 。 
12.4 StringlO 函数 


数据 的 读 取 除 了 通过 文件 , 还 可 以 在 内 存 中 进行 。Python 中 的 io 模块 提供 了 对 str 操作 的 
StringIO 函数 。 
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要 把 str 写 入 StringIO， 我 们 需要 创建 一 个 StringIO， 然 后 像 文件 一 样 写 入 。 操 作 示例 如 下 ; 
#! /usr/bin/python 
#-*-coding:UTF-8-*- 
from io import StringIO 
io_val = StringIOO 
io_val.write(hello) 
Print('say:', io_val.getvalue()) 
执行 结果 为 : 
say: hello 
由 执行 结果 看 到 ，getvalue() 方 法 用 于 获得 写 入 后 的 str。 
要 读 取 StringIO， 还 可 以 用 str 初始 化 StringIO， 然 后 像 读 文件 一 样 读 取 。 操 作 示 例如 下 : 
#! /usr/bin/python 
#-*-coding:UTF-8-*- 
from io import StringIO 
io_val = StringIO('Hellon World!n Welcome!') 
while True: 

line = io_val.readline() 

ifline 一 ": 

break 
print('line value:', line.stripO) 


执行 结果 如 下 : 
line value: Hello 


line value: World! 


line value: Welcome! 


12.5 序列 化 与 反 序列 化 


在 运行 程序 的 过 程 中 ， 所 有 变量 都 在 内 存 中 ， 我 们 把 变量 从 内 存 中 变 成 可 存储 或 传输 的 
过 程 称 为 序列 化 。 我 们 可 以 把 序列 化 后 的 内 容 写 入 磁盘 , 或 者 通过 网 络 传输 到 别 的 机 器 上 。 反 
过 来 ， 把 变量 内 容 从 序列 化 的 对 象 重 新 读 到 内 存 里 称 为 反 序 列 化 。 

序列 化 是 指 将 数据 结构 或 对 象 转换 成 二 进 制 串 的 过 程 。 

反 序 列 化 是 指 将 序列 化 过 程 中 生成 的 二 进 制 串 转换 成 数据 结构 或 对 象 的 过 程 。 

下 面 我 们 介绍 Python 中 序列 化 和 反 序 列 化 的 方式 。 
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12.5.1 一 般 序列 化 与 反 序列 化 


Python 的 pickle 模块 实现 了 基本 数据 序列 和 反 序列 化 。 

通过 pickle 模块 的 序列 化 操作 ， 能 够 将 程序 中 运行 的 对 象 信息 保存 到 文件 中 ， 从 而 永久 
存储 。 

通过 pickle 模块 的 反 序 列 化 操作 ， 能 够 从 文件 中 创建 上 一 次 程序 保存 的 对 象 。 

pickle 模块 的 基本 接口 如 下 : 

pickle.dump(obj, file, [,protocol]) 

例如 : 


#! /usr/bin/python 
#-*-coding:UTF-8-*- 
import pickle 
d= dict(name='xiao zhi', num=1002) 
print(pickle.dumps(d)) 
pickle.dumps() 方 法 把 任意 对 象 序列 化 成 一 个 bytes， 然 后 把 这 个 bytes 写 入 文件 。 也 可 以 
使 用 另 一 种 方法 pickle.dump()， 直 接 把 对 象 序列 化 后 写 入 一 个 文件 对 象 中 ， 程 序 如 下 : 
try: 
f name = open('dump.txt', 'wb') 
pickle.dump(d, f name) 
finally: 
f name.close() 


打开 dump.txt 文件 ， 可 以 看 到 里 面 是 一 堆 看 不 懂 的 内 容 ， 这 些 都 是 Python 保存 的 对 象 内 
部 信息 。 
既然 已 经 将 内 容 序列 化 到 文件 中 了 ， 使 用 文件 时 就 需要 把 对 象 从 磁盘 读 到 内 存 。 可 以 先 
把 内 容 读 到 一 个 bytes， 然 后 用 pickle.loads() 方 法 反 序列 化 对 象 ， 也 可 以 直接 用 pickle.load() 方 
法 从 一 个 文件 对 象 中 直接 反 序列 化 对 象 。 从 dump.txt 文件 中 将 序列 化 的 内 容 反 序列 化 的 代码 
如 下 > 
#! /usr/bin/python 
#-*-coding:UTF-8-*- 
import pickle 
try: 
f name = open(dump.txt,rb) 
print('load result:', pickle.load(f name)) 
finally: 
f name.close() 
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执行 结果 如 下 : 

load result: fnum': 1002, name': 'xiao zhi'} 

由 执行 结果 看 到 ， 变 量 的 内 容 被 正确 读 取出 来 了 。 不 过 ， 虽 然 内 容 相 同 ， 但 是 对 应 的 变 
量 已 经 完全 不 同 了 。 


Pickle 的 序列 化 和 反 序列 化 只 能 用 于 Python， 不 同 版 本 的 Python 可 能 彼此 都 不 兼容 ， 因 此 
注意 Pickle 一 般 用 于 保存 不 重要 的 数据 ， 也 就 是 不 能 成 功 反 序列 化 也 没关系 的 数据 。 


12.5.2 ”JSON 序列 化 与 反 序 列 化 


我 们 在 12.5.1 小 节 介绍 的 pickle 模块 是 Python 中 独 有 的 序列 化 与 反 序列 化 模块 ， 本 节 介 
绍 的 JSON 方式 是 通用 的 。 

JSON (JavaScript Object Notation) 是 一 种 轻 量 级 的 数据 交换 格式 ， 是 基于 ECMAScript 
的 一 个 子 集 。 

Python 3 中 可 以 使 用 json 模块 对 JSON 数据 进行 编码 解码 ， 包 含 以 下 两 个 函数 。 

e json.dumps0: 对 数据 进行 编码 。 

e@ json.loads0: 对 数据 进行 解码 。 

在 JSON 的 编码 解码 过 程 中 ,Python 的 原始 类 型 与 JSON 类 型 会 相互 转换 , 具体 的 转化 对 
照 如 表 12-2 和 表 12-3 所 示 。 

表 12-2 “Python 编码 为 JSON 类 型 























Python JSON 
dict 0} 
list, tuple 0 
str string 
Int or float number 
True/False true/false 
None null 

表 12-3 JSON 解码 为 Python 类 型 

JSON Python 
0 dict 
0 list 
string str 
number (int or float) int or float 
true/false True/False 
null None 
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下 面 是 JSON 序列 化 与 反 序列 化 的 示例 : 


#! /usr/bin/python 
#-*-coding:UTF-8-*- 


import json 


data = { mum': 1002, "name': 'xiao zhi"} 
json_str = json.dumps(data) 
print("Python 原始 数据 : ", data) 
print("JSON 对 象 : ", json_str) 


执行 结果 如 下 : 

Python 原始 数据 :f'name': 'xiao zhi', num': 1002} 

JSON 对 象 : {"name": "xiao zhi", "num": 1002} 

接着 以 上 示例 ， 我 们 可 以 将 一 个 JSON 编码 的 字符 串 转 换 为 一 个 Python 数据 结构 ， 代 码 
如 下 : 

#! /usr/bin/python 

#-*-coding:UTF-8-*- 


import json 
data = { ‘num': 1002, "name': 'xiao zhi'} 


json_str = json.dumps(data) 
print("Python 原始 数据 :", data) 
print("JSON 对 和 象 :", json_str) 


data2 = json.loads(json_str) 

print ("data2['name']: ", data2['name']) 

Pprint ("data2['num']: ", data2['num']) 

执行 结果 如 下 : 

Python 原始 数据 : 《mnum': 1002, mame': 'xiao zhi'} 
JSON 对 象 : {"num": 1002, "name": "xiao zhi"} 
data2[mame']: xiao zhi 

data2[mum']: 1002 


如 果 要 处 理 的 是 文件 而 不 是 字符 串 ， 就 可 以 使 用 json.dump() 和 json.load0 编 码 、 解 码 
JSON 数据 ， 进 行 如 下 处 理 : 
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# 写 入 JSON 数据 
with open('dump.txt', 'w') asf: 
json.dump(data, f) 


# 读 取 数据 
with open(dump.txt, mr) asf: 
data = json.load(f) 


12.6 调 试 


当 我 们 读 取 和 写 入 文件 时 ， 经 常 遇 到 和 空白 字符 相关 的 问题 。 这 些 问 题 可 能 很 难 调试 
因为 空格 、 制 表 符 和 换行 符 通常 是 不 可 见 的， 例如 : 

>>>gstr_ val='12t3m45' 

>>> print(str_ val) 

123 

45 


在 这 种 情况 下 ，Python 为 我 们 提供 了 repr 函数 。 该 函数 可 接收 任何 对 象 作 为 参数 ， 并 返 
回 对 象 的 字符 串 表达 形式 。 上 面 的 示例 可 以 更 改 为 : 


>>> print(repr(str_val)) 
'12t3n45 


结果 把 字符 原本 输出 了 。 在 实际 应 用 中 ， 使 用 这 种 方式 可 以 帮助 调试 。 

男 一 个 经 常 遇 到 的 问题 是 不 同系 统 使 用 不 同 的 字符 表示 换行 。 有 的 系统 使 用 换行 符 (\n) 
表示 换行 ， 有 的 系统 使 用 回 车 符 (\r) 表示 换行 ， 也 有 的 系统 两 者 都 使 用 。 如 果 我 们 编写 的 代 
码 在 不 同系 统 上 使 用 ， 这 些 不 一 致 就 可 能 导致 异常 。 

当然 ， 大 多 系统 都 有 程序 支持 将 一 种 格式 转换 为 另 一 种 格式 。 如 果 不 能 满足 要 求 ， 读 者 
也 可 以 自己 写 一 个 。 





12.7 “问题 解答 


在 Python 中 ， 文 件 的 操作 应 用 得 多 吗 ? 

答 : 在 Python 中 ， 文 件 的 操作 应 用 得 非常 多 。 比 如 大 数据 领域 ， 涉 及 许多 数据 处 理 的 需 
求 ， 数 据 处 理 就 是 从 一 个 文件 对 数据 进行 相关 分 析 、 抽 取 或 重 写 后 ， 再 写 入 另 一 个 文件 ， 通 过 
对 不 同文 件 的 数据 处 理 与 加 工 ， 从 而 达到 化 繁 为 简 、 梳 理 数 据 的 作用 。 在 这 个 过 程 中 ,很 多 地 
方 都 需要 使 用 Python 脚本 实现 。 


"269。 





Python 3.5 从 零 开 始 学 





12.8 温 故 知 新 ， 学 以 致 用 


本 章 主要 讲述 了 正则 表达 式 的 相关 知识 ， 在 本 章 结 束 前 回顾 一 下 学 到 的 概念 。 
(1) 怎么 打开 和 关闭 文件 ? 

(2) 如 何 对 行进 行 读 和 写 ? 

(3) 怎么 迭代 文件 内 容 ? 

思考 并 尝试 解决 如 下 问题 : 


(1) 使 用 本 章 所 学 向 一 个 文件 中 写 入 一 首 诗 ， 要 求 打开 文件 看 到 的 文本 格式 像 一 首 诗 ， 
即 标题 在 中 间 位 置 ， 一 句 诗 一 行 。 

(2) 结合 当前 所 学 或 参考 网 上 资料 ， 更 改 诗句 中 某 个 字 。 

(3) 统计 诗 中 各 个 词 或 字 出 现 的 频率 ， 将 统计 结果 写 入 另 一 个 文件 中 。 统 计 结 果 格 式 自 
己 定 义 〈 越 简单 、 清 楚 越 好 ) 。 
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第 1 多 线 程 


多 线程 编程 技术 可 以 实现 代码 并 行 , 优化 处 理 能 力 , 同 
时 可 以 将 代码 划分 为 功能 更 小 的 模块 ， 使 代码 的 可 重用 性 
更 好 。 

本 章 将 介绍 Python 中 的 多 线程 编程 。 多 线程 一 直 是 
Python 学 习 中 的 重点 和 难点 ， 需 要 反复 练习 和 研究 。 
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13.1 ”线程 和 进程 


在 学 习 多 线程 的 使 用 之 前 ， 需 要 先 了 解 线程 、 进 程 、 多 线程 的 概念 。 
13.1.1 进程 


进程 (Process， 有 时 被 称 为 重量 级 进程 》 是 程序 的 一 次 执行 。 每 个 进程 都 有 自己 的 地 址 
空间 、 内 存 、 数 据 栈 以 及 记录 运行 轨迹 的 辅助 数据 ,操作 系统 管理 运行 的 所 有 进程 ， 并 为 这 些 
进程 公平 分 配 时 间 。 进 程 可 以 通过 fork 和 spawn 操作 完成 其 他 任务 。 因 为 各 个 进程 有 自己 的 
内 存 空间 、 数 据 栈 等 ， 所 以 只 能 使 用 进程 间 通 信 (CIPC) ， 而 不 能 直接 共享 信息 。 


13.1.2 ”线程 


线程 (Thread， 有 时 被 称 为 轻 量 级 进程 ) 跟 进程 有 些 相似 ， 不 同 的 是 所 有 线程 运行 在 同一 
个 进程 中 ， 共 享 运行 环境 。 

线程 有 开始 、 顺 序 执行 和 结束 3 部 分 ， 有 一 个 自己 的 指令 指针 ， 记 录 运 行 到 什么 地 方 。 
线程 的 运行 可 能 被 抢占 《中断 ) 或 暂时 被 挂 起 《睡眠 ) ， 从 而 让 其 他 线程 运行 ， 这 叫 作 让 步 。 

-个 进程 中 的 各 个 线程 之 间 共 享 同 一 片 数据 空间 ,所 以 线程 之 间 可 以 比 进程 之 间 更 方便 地 共享 
数据 和 相互 通信 。 

线程 一 般 是 并 发 执行 的 。 正 是 由 于 这 种 并 行 和 数据 共享 的 机 制 ， 使 得 多 个 任务 的 合作 变 
得 可 能 。 实 际 上 ， 在 单 CPU 系统 中 ， 真 正 的 并 发 并 不 可 能 ， 每 个 线程 会 被 安排 成 每 次 只 运行 

-小 会 儿 ， 然 后 就 把 CPU 让 出 来 ， 让 其 他 线程 运行 。 

在 进程 的 整个 运行 过 程 中 ， 每 个 线程 都 只 做 自己 的 事 ， 需 要 时 再 跟 其 他 线程 共享 运行 结 
果 。 多 个 线程 共同 访问 同一 片 数据 不 是 完全 没有 和 危险 的 ,由 于 数据 访问 的 顺序 不 一 样 ， 因 此 有 
可 能 导致 数据 结果 不 一 致 的 问题 ,这 叫 作 竞 态 条 件 。 大 多 数 线程 库 都 带 有 一 系列 同步 原 语 , 用 
于 控制 线程 的 执行 和 数据 的 访问 。 


13.1.3 ”多 线程 与 多 进程 


对 于 “多 任务 ”这 个 词 , 相信 读者 不 会 第 一 次 看 见 , 现在 的 操作 系统 (如 Mac OS X、UNIX、 
Linux、Windows 等 ) 都 支持 “多 任务 ”操作 系统 。 

什么 叫 “ 多 任务 ” 呢 ? 简单 地 说 ， 就 是 系统 可 以 同时 运行 多 个 任务 。 比 如 ， 一 边 用 浏览 
器 上 网 ， 一 边 听 云 音乐 ,一 边 聊天 ， 这 就 是 多 任务 。 此 时 手头 已 经 有 3 个 任务 在 运行 了 。 如 果 
查看 任务 管理 器 ， 可 以 看 到 还 有 很 多 任务 悄悄 在 后 台 运 行 着 ， 只 是 桌面 上 没有 显示 而 已 。 

对 于 操作 系统 来 说 ， 一 个 任务 就 是 一 个 进程 ， 开 启 多 个 任务 就 是 多 进程 。 

有 些 进程 不 止 可 以 同时 做 一 件 事 ， 比 如 Word 可 以 同时 打字 、 拼 写 检查 、 打 印 等 。 在 一 个 
进程 内 部 ， 要 同时 做 多 件 事 ， 就 需要 同时 运行 多 个 线程 。 
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(1) 使 用 线程 可 以 把 占据 长 时 间 的 程序 中 的 任务 放 到 后 台 去 处 理 。 

(2) 用 户 界面 可 以 更 加 吸引 人 ， 比 如 用 户 单 击 一 个 按钮 ， 用 于 触发 某 些 事件 的 处 理 ， 可 
以 弹出 一 个 进度 条 显示 处 理 的 进度 。 

(3) 程序 的 运行 速度 可 能 加 快 。 


在 实现 一 些 等 待 任务 〈 如 用 户 输入 、 文 件 读 写 和 网 络 收发 数据 等 ) 时 ， 使 用 多 线程 更 加 
有 用 。 在 这 种 情况 下 ， 我 们 可 以 释放 一 些 珍贵 资源 〈 如 内 存 占 用 等 ) 。 

线程 在 执行 过 程 中 与 进程 还 是 有 区 别 的 。 每 个 独立 线程 有 一 个 程序 运行 的 入 口 、 顺 序 执 
行 序 列 和 程序 的 出 口 。 但 是 线程 不 能 独立 执行 ,必须 依存 在 进程 中 ， 由 进程 提供 多 个 线程 执行 
控制 。 

由 于 每 个 进程 至 少 要 干 一 件 事 ， 因 此 一 个 进程 至 少 有 一 个 线程 。 当 然 , 如 Word 这 种 复杂 
的 进程 可 以 有 多 个 线程 ， 多 个 线程 可 以 同时 执行 。 多 线程 的 执行 方式 和 多 进程 是 一 样 的, 也 是 
由 操作 系统 在 多 个 线程 之 间 快 速 切 换 , 让 每 个 线程 都 短暂 交替 运行 , 看 起 来 就 像 同时 执行 一 样 。 
当然 ， 真 正 同时 执行 多 线程 需要 多 核 CPU 才能 实现 。 

我 们 前 面 编写 的 所 有 Python 程序 都 是 执行 单 任务 的 进程 ， 也 就 是 只 有 一 个 线程 。 如 果 我 
们 要 同时 执行 多 个 任务 ， 怎 么 办 呢 ? 

有 两 种 解决 方法 : 一 种 方法 是 启动 多 个 进程 ， 每 个 进程 虽然 只 有 一 个 线程 ， 但 多 个 进程 
可 以 一 起 执行 多 个 任务 。 另 一 种 方法 是 启动 一 个 进程 ， 在 一 个 进程 内 启动 多 个 线程 ， 这 样 多 个 
线程 也 可 以 一 起 执行 多 个 任务 。 

当然 ， 还 有 第 3 种 方法 ， 就 是 启动 多 个 进程 ， 每 个 进程 再 启动 多 个 线程 ， 这 样 同时 执行 
的 任务 就 更 多 了 ， 不 过 这 种 模型 过 于 复杂 ， 实 际 很 少 采用 。 

同时 执行 多 个 任务 时 ， 各 个 任务 之 间 并 不 是 没有 关联 的 ， 而 是 需要 相互 通信 和 协调 ， 有 
时 任务 1 必须 暂停 等 待 任务 2 完成 后 才能 继续 执行 , 有 时 任务 3 和 任务 4 不 能 同时 执行 。 多 进 
程 和 多 线程 程序 的 复杂 度 远 远 高 于 我 们 前 面 写 的 单 进程 、 单 线程 的 程序 。 

不 过 很 多 时 候 ， 没 有 多 任务 还 真 不 行 。 想 想 在 电脑 上 看 电影 ， 必 须 由 一 个 线程 播放 视频 ， 
另 一 个 线程 播放 音频 , 否则 使 用 单线 程 实现 只 能 先 把 视频 播放 完 再 播放 音频 , 或 者 先 把 音频 播 
放 完 再 播放 视频 ， 这 样 显然 不 行 。 

总 而 言 之 ， 多 线程 是 多 个 相互 关联 的 线程 的 组 合 ， 多 进程 是 多 个 互相 独立 的 进程 的 组 合 。 
线程 是 最 小 的 执行 单元 ， 进 程 至 少 由 一 个 线程 组 成 。 


13.2 ”使 用 线程 

















如 何 使 用 线程 ， 线 程 中 有 哪些 比较 值得 学 习 的 模块 呢 ? 本 节 将 对 线程 的 使 用 做 概念 性 的 
讲解 ， 下 一 节 再 给 出 一 些 具体 示例 以 供 参考 。 


13.2.1 全 局 解释 器 锁 
Python 代码 的 执行 由 Python 虚拟 机 (解释 器 主 循环 ) 控制 。Python 在 设计 之 初 就 考虑 到 
在 主 循环 中 只 能 有 一 个 线程 执行 ， 虽 然 Python 解释 器 中 可 以 “运行 ”多 个 线程 ， 但 是 在 任意 
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时 刻 只 有 一 个 线程 在 解释 器 中 运行 。 

Python 虚拟 机 的 访问 由 全 局 解释 器 锁 (GIL) 控制 ， 这 个 锁 能 保证 同一 时 刻 只 有 一 个 线程 
运行 。 

在 多 线程 环境 中 ，Python 虚拟 机 按 以 下 方式 执行 : 

(1) 设置 GIL。 

(2) 切换 到 一 个 线程 运行 。 

(3) 运行 指定 数量 的 字 节 码 指令 或 线程 主动 让 出 控制 (可 以 调用 time.sleep(0))。 

(4) 把 线程 设置 为 睡眠 状态 。 

(5) 解锁 GIL。 

(6) 再 次 重复 以 上 所 有 步骤 。 


在 调用 外 部 代码 (如 C/C++ 扩展 函数 ) 时 ，GIL 将 被 锁定 。 直 到 这 个 函数 结束 为 止 ( 由 于 
在 此 期 间 没有 运行 Python 的 字 节 码 ， 因 此 不 会 做 线程 切换 ) ， 编 写 扩展 的 程序 员 可 以 主动 解 
锁 GIL。 


13.2.2 ”退出 线程 


当 一 个 线程 结束 计算 ， 它 就 退出 了 。 线 程 可 以 调用 _thread.exit() 等 退出 函数 ， 也 可 以 使 用 
Python 退出 进程 的 标准 方法 (如 sys.exit0 或 抛 出 一 个 SystemExit 异常 ) ， 不 过 不 可 以 直接 “和 杀 
掉 ” (kill) 一 个 线程 。 

不 建议 使 用 _thread 模块 。 很 明显 的 一 个 原因 是 ， 当 主线 程 退出 时 ， 其 他 线程 如 果 没 有 被 
清除 就 会 退出 。 另 一 个 模块 threading 能 确保 所 有 “重要 的 ” 子 线程 都 退出 后 ， 进 程 才 会 结束 。 


13.2.3 ”Python 的 线程 模块 


Python 提供 了 几 个 用 于 多 线程 编程 的 模块 ， 包 括 _ thread、threading 和 Queue 等 。_thread 
和 threading 模块 允许 程序 员 创建 和 管理 线程 。_thread 模块 提供 了 基本 线程 和 锁 的 支持 ， 
threading 提供 了 更 高 级 别 、 功 能 更 强 的 线程 管理 功能 。 Queue 模块 允许 用 户 创建 一 个 可 以 用 于 
多 个 线程 之 间 共 享 数据 的 队列 数据 结构 。 

避免 使 用 _thread 模块 ， 原 因 有 3 点 。 首 先 ， 更 高 级 别 的 threading 模块 更 为 先进 ， 对 线程 
的 支持 更 为 完善 ， 而 且 使 用 _thread 模块 里 的 属性 有 可 能 与 threading 冲突 ， 其 次 ， 低 级 别 的 
_thread 模块 的 同步 原 语 很 少 (实际 上 只 有 一 个 ) ， 而 threading 模块 有 很 多 ; 再 者 ，_thread 模 
块 中 在 主线 程 结束 时 ， 所 有 线程 都 会 被 强制 结束 ， 没 有 警告 也 不 会 有 正常 清除 工作 ， 至 少 
threading 模块 能 确保 重要 子 线程 退出 后 进程 才 退 出 。 





13.3 thread 模块 


Python 中 调用 _thread 模块 中 的 start_new_thread() 函 数 产生 新 线程 。_thread 的 语法 如 下 : 


_thread.start_new_thread (function, args[, kwargs]) 
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其 中 ，function 为 线程 函数 ，args 为 传递 给 线程 函数 的 参数 ， 必 须 是 tuple 类 型 ，kwargs 
为 可 选 参数 。 

_thread 模块 除了 产生 线程 外 , 还 提供 基本 同步 数据 结构 锁 对 象 (lock object, 也 叫 原 语 锁 、 
简单 锁 、 互 斥 锁 、 互 斥 量 、 二 值 信号 量 ) 。 同 步 原 语 与 线程 管理 是 密 不 可 分 的 。 

我 们 看 如 下 示例 。 

#! /usr/bin/python 

# -*-coding:UTF-8-*- 


import _thread 
from time import sleep 
from datetime import datetime 


date_time format = '%y-%M-%d %H:%M:%S' 


def date_time str(date_time): 
Teturn datetime.strftime(date_time, date_time_format) 


def loop_one(): 
print(+++ 线 程 一 开始 于 :" date_time_str(datetime.now())) 
print(+++ 线 程 一 休眠 4 秒 ) 
sleep(4) 
print(+++ 线 程 一 休眠 结束 ， 结 束 于 :, date_time_str(datetime.now())) 


def loop_two(): 
print(*** 线 程 二 开始 时 间 :', date_time_str(datetime.now())) 
print(*** 线 程 二 休 眼 2 秒 ) 
sleep(2) 
print(*** 线 程 二 休眠 结束， 结束 时 间 :', date_time_str(datetime.now0)) 


def main(): 
print(------ 所 有 线程 开始 时 间 :', date_time_str(datetime.now())) 
_thread.start_ new_thread(loop_one, ()) 
_thread.start_new_thread(loop_two, ()) 
sleep(6) 
print('------ 所 有 线程 结束 时 间 :', date_time_str(datetime.now())) 


if_name 一" main 


main() 
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执行 结果 如 下 : 
| 所 有 线程 开始 时 间 : 16-44-06 21:44:05 
+++ 线 程 一 开始 于 : 16-44-06 21:44:05 
+++ 线 程 一 休眠 4 秒 
*** 线 程 二 开始 时 间 : 16-44-06 21:44:05 
*** 线 程 二 休 眼 2 秒 
*** 线 程 二 休眠 结束 ， 结 束 时 间 : 16-44-06 21:44:07 
+++ 线 程 一 休眠 结束 ， 结 束 于 : 16-44-06 21:44:09 
三 二 所 有 线程 结束 时 间 : 16-44-06 21:44:11 
_thread 模块 提供 了 简单 的 多 线程 机 制 ， 两 个 循环 并 发 执行 ， 总 的 运行 时 间 为 最 慢 的 线程 
的 运行 时 间 〈 主 线程 66) ， 而 不 是 所 有 线程 的 运行 时 间 之 和 。start_new_thread() 要 求 至 少 传 两 
个 参数 ， 即 使 想 要 运行 的 函数 不 要 参数 ， 也 要 传 一 个 空 元 组 。 
sleep(6) 是 让 主线 程 停 下 来 。 主 线程 一 旦 运行 结束 ， 就 关闭 运行 着 的 其 他 两 个 线程 。 这 可 
能 造成 主线 程 过 早 或 过 晚 退出 , 这 时 就 要 使 用 线程 锁 , 主线 程 可 认 在 两 个 子 线程 都 退出 后 立即 
退出 。 
示例 代码 如 下 : 
#! /usr/bin/python 
# -#-coding:UTF-8-*#- 
import _thread 
from time import Sleep 
位 om datetime import datetime 
loops= [4, 2] 
date_time_format = '%y-%M-%d %H:%M:%S' 
def date_time _str(date_time): 
return datetime.strftime(date_time, date_time_format) 
def loop(n_loop, n_sec, lock): 
print(' 线 程 (', n_loop, ') 开 始 执行 
date_time_str(datetime.now0),'， 先 休 眼 (', n_sec, ') 秒 ) 
sleep(n_sec) 
print(' 线 程 ('", n_loop, ') 休 眼 结束 ， 结 束 于 :', date_time_str(datetime.now())) 
lock.release| 
def main(): 
print('-- 所 有 线程 开始 执行 .…') 
locks=[] 
n_loops = range(len(loops)) 
for iin n_ loops: 
lock = _thread.allocate_lock() 
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lock.acquire() 
locks.append(lock) 
for iin n_loops: 
_thread.start_ new_thread(loop, (i, loops[i], locks[i])) 


for iin n_loops: 
while locks[i].locked(): pass 

print('-- 所 有 线程 执行 结束 :', date_time str(datetime.nowO)) 
if_name 一 ”main 

main() 
执行 结果 如 下 : 
--- 所 有 线程 开始 执行 … 
线程 ( 1 ) 开始 执行 : 16-44-06 21:44:11 ， 先 休眠 ( 2 ) 秒 
线程 ( 0 ) 开始 执行 : 16-44-06 21:44:11 ， 先 休眠 〈 4 ) 秒 
线程 ( 1 ) 休眠 结束 ， 结 束 于 : 16-44-06 21:44:13 


线程 ( 0 ) 休眠 结束 ， 结 束 于 : 16-44-06 21:44:15 
--- 所 有 线程 执行 结束 : 16-44-06 21:44:15 


可 以 看 到 ， 以 上 代码 使 用 了 线程 锁 。 
13.4 _ threading 模块 


更 高 级 别 的 threading 模块 不 仅 提 供 了 Thread 类 ， 还 提供 了 各 种 非常 好 用 的 同步 机 制 。 

_thread 模块 不 支持 守护 线程 ， 当 主线 程 退出 时 ， 所 有 子 线程 无 论 是 否 在 工作 ， 都 会 被 强 
行 退出 。threading 模块 支持 守护 线程 ， 守 护 线 程 一 般 是 一 个 等 待 客户 请 求 的 服务 器 ， 如 果 没 
有 客户 提出 请 求 ， 就 一 直 等 着 。 如 果 设 定 一 个 线程 为 守护 线程 ， 就 表示 这 个 线程 不 重要 ， 在 进 
程 退出 时 , 不 用 等 待 这 个 线程 退出 。 如 果 主 线程 退出 时 不 用 等 待 子 线程 完成 , 就 要 设 定 这 些 线 
程 的 daemon 属性 ， 即 在 线程 Thread.start0 开 始 前 ， 调 用 setDaemon() 函 数 设 定 线 程 的 daemon 
标志 (Thread.setDaemon(True)) ， 表 示 这 个 线程 “不 重要 ”。 如 果 一 定 要 等 待 子 线程 执行 完 
成 再 退出 主线 程 ， 就 什么 都 不 用 做 或 显 式 调用 Thread.setDaemon(False) 以 保证 daemon 标志 为 
False， 可 以 调用 Thread.isDaemon() 函 数 判断 daemon 标志 的 值 。 新 的 子 线程 会 继承 父 线程 的 
daemon 标志 ， 整 个 Python 在 所 有 非 守护 线程 退出 后 才 会 结束 ， 即 进程 中 没有 非 守护 线程 存在 
时 才 结 束 。 


threading 的 Thread 类 


Thread 有 很 多 _thread 模块 里 没有 的 函数 ,Thread 对 象 的 函数 很 丰富 。 下 面 创建 一 个 Thread 
的 实例 ， 传 给 它 一 个 函数 。 示 例如 下 : 
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#! /usr/bin/python 
# -*-coding:UTF-8-*- 


import threading 
from time import sleep 
from datetime import datetime 


loops = [4, 2] 
date_time format ='%y-%M-%d %H:%M:%S' 


def date_time str(date_time): 
return datetime.strftime(date_time, date_time format) 


def loop(n_loop, n_sec): 
print( 线 程 (', n_loop,') 开始 执行 : 
date_time_str(datetime.now0), '， 先 休眠 (', n_sec, ') 秒 ) 
sleep(n_sec) 
print( 线 程 (', n_loop, ') 休 卢 结束， 结束 于 :', date_time_str(datetime.now())) 


def main(): 
print(--- 所 有 线程 开始 执行 :', date_time_str(datetime.now())) 
threads =[] 


n_loops = range(len(loops)) 


for iin n_loops: 
t= threading.Thread(target=loop, args=(i, loops[i])) 
threads.append(t) 


for iin n_loops: # start threads 
threads[i].start() 


for iin n_loops: # wait for all 
threads[i].join() # threads to finish 


print('--- 所 有 线程 执行 结束 于 :', date_time_str(datetime.now())) 


if_name 一 '_ main 
main() 

执行 结果 如 下 : 

--- 所 有 线程 开始 执行 : 16-44-06 21:44:15 

线程 ( 0 ) 开始 执行 : 16-44-06 21:44:15 ， 先 休眠 〈 4 ) 秒 
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线程 ( 1 ) 开始 执行 : 16-44-06 21:44:15 ， 先 休眠 ( 2 ) 秒 
线程 ( 1 ) 休眠 结束 ， 结 束 于 : 16-44-06 21:44:17 

线程 ( 0 ) 休眠 结束 ， 结 束 于 : 16-44-06 21:44:19 

--- 所 有 线程 执行 结束 于 : 16-44-06 21:44:19 


由 执行 结果 我 们 看 到 , 实例 化 一 个 Thread (调用 Thread()) 与 调用 _thread.start_ new_thread() 


最 大 的 





区 别 是 新 的 线程 不 会 立即 开始 。 创 建 线程 对 象 却 不 想 马 上 开始 运行 线程 时 ，Thread 是 


-个 很 有 用 的 同步 特性 。 所 有 线程 都 创建 之 后 ， 再 一 起 调用 startO 函 数 启动 ， 而 不 是 每 创建 一 


个 线程 
只 要 简 


就 启动 。 而 且 不 用 管理 一 堆 锁 的 状态 〈 分 配 锁 、 获 得 锁 、 释 放 锁 、 检 查 锁 的 等 状态 ) ， 


单 对 每 个 线程 调用 join() 主 线程 ， 等 待 子 线程 结束 即 可 。join0 还 可 以 设置 timeout 参数 ， 


即 主线 程 的 超时 时 间 。 
join0 的 另 一 个 比较 重要 的 方面 是 可 以 完全 不 用 调用 。 一 旦 线程 启动 ， 就 会 一 直 运行 ， 直 


到 线程 





的 函数 结束 并 退出 为 止 。 如 果 主 线程 除了 等 线程 结束 外 ,还 有 其 他 事情 要 做 ， 就 不 用 调 


用 join0)， 只 有 在 等 待 线程 结束 时 才 调 用 。 
我 们 再 看 示例 ， 创 建 一 个 Thread 的 实例 ， 并 传 给 它 一 个 可 调用 的 类 对 象 。 代 码 如 下 : 
#! /usr/bin/python 
# -#-coding:UTF-8-*#- 


import threading 
from time import sleep 
位 om datetime import datetime 


loops = [4, 2] 
date_time_format = '"%y-%M-%d %H:%M:%S' 


class ThreadFunc(object): 


def__ init_ (self, func, args, name="): 
selfname = name 
self.func = func 
self.args = args 


def call_ (self): 
self.func(*self.args) 


def date_time_str(date_time): 


Teturn datetime.strftime(date_time, date_time format) 


def loop(n_loop, n_sec): 


print( 线 程 (', n_loop,') 开始 执行 :, 
date time _str(datetime.now0),'， 先 休眠 〈',n_sec,')) 秒 ) 
Sleep(n_sec) 
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Print(' 线 程 (', n_loop, ') 休眠 结束 ， 结 束 于 :', date time str(datetimenow(O)) 


def main(): 
print(--- 所 有 线程 开始 执行 :, date_ time _str(datetime.now())) 
threads =[] 


nloops = range(len(loops)) 


foriin nloops: # create allthreads 
t= threading.Thread( 
target=ThreadFunc(loop, (i, loops[i]), loop. name_)) 
threads.append(t) 


foriin nloops: # Sstartall threads 
threads[i].start() 


foriin nloops: # wait for completion 
threads[i].join() 


print('--- 所 有 线程 执行 结束 于 :', date_time_str(datetime.now())) 
让 _name 一 ”main 

main() 
执行 结果 如 下 : 
--- 所 有 线程 开始 执行 : 16-03-06 22:03:18 
线程 ( 0 ) 开始 执行 : 16-03-06 22:03:18 ， 先 休眠 〈 4 ) 秒 
线程 ( 1 ) 开始 执行 : 16-03-06 22:03:18 ， 先 休眠 〈 2 ) 秒 
线程 ( 1 ) 休眠 结束 ， 结 束 于 : 16-03-06 22:03:20 


线程 ( 0 ) 休眠 结束 ， 结 束 于 : 16-03-06 22:03:22 
--- 所 有 线程 执行 结束 于 : 16-03-06 22:03:22 


由 执行 结果 看 到 ， 与 传 一 个 函数 很 相似 的 一 个 方法 是 ， 在 创建 线程 时 ， 传 一 个 可 调用 的 
类 的 实例 供 线程 启动 时 执行 , 这 是 多 线程 编程 的 一 个 面向 对 象 的 方法 。 相 对 于 一 个 或 几 个 函数 
来 说 ， 类 对 象 可 以 使 用 类 的 强大 功能 。 创 建新 线程 时 ，Thread 对 象 会 调用 ThreadFunc 对 象 ， 





这 时 会 用 到 一 个 特殊 函数 _ call _(0)。 上 











于 已 经 有 了 要 用 的 参数 ,因此 不 用 再 传 到 Thread() 的 构 





造 函 数 中 。 对 于 有 一 个 参数 的 元 组 ， 要 使 用 self.func(*self.args) 方 法 。 
从 Thread 派生 一 个 子 类 ， 创 建 这 个 子 类 的 实例 。 从 上 面 的 代码 派生 的 代码 如 下 : 


#! /usr/bin/python 
#-*-coding:UTF-8-*- 


import threading 
from time import sleep 
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from datetime import datetime 


loops = [4, 2] 
date_time format ='%y-%M-%d %H:%M:%S' 


class MyThread(threading.Thread): 
def init (self, func, args,name="): 
threading.Thread. init (self) 
self.name = name 
self.func = func 
self.args = args 


def getResult(self): 
Treturn self.res 


def run(self): 
print('starting’, self.name, 'at:', date_time_str(datetime.now())) 
self.res = self.func(*self.args) 
print(self.name, finished at:', date_time_str(datetime.now())) 


def date time _str(date_time): 
return datetime.strftime(date_time, date_time_format) 


def loop(n_loop, n_sec): 
print(' 线 程 ('", n_loop, ') 开始 执行 :， 
date_time_str(datetime.now0),'， 先 休 眼 (', n_sec, ') 秒 ') 
sleep(n_sec) 


print(' 线 程 (', n_loop, ') 休 眼 结束 ， 结 束 于 :', date_time_str(datetime.now())) 


def main(): 
print('--- 所 有 线程 开始 执行 :', date_time_str(datetime.now())) 
threads = [] 


n_loops = range(len(loops)) 

for iin n_loops: 
t= MyThread(loop, (i, loops[i]), 
loop. name ) 
threads.append(t) 


for iin n_loops: 
threads[i].start() 


for iinn_loops: 
threads[i].join() 


print('-- 所 有 线程 执行 结束 于 :', date_time_str(datetime.now())) 
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if_name 一 ' main ': 
main() 
执行 结果 如 下 : 
--- 所 有 线程 开始 执行 : 16-22-06 22:22:20 
starting loop at: 16-22-06 22:22:20 
线程 ( 0 ) 开始 执行 : 16-22-06 22:22:20 ， 先 休 眼 ( 4 ) 秒 
starting loop at: 16-22-06 22:22:20 
线程 ( 1 ) 开始 执行 : 16-22-06 22:22:20 ， 先 休眠 〈 2 ) 秒 
线程 ( 1 ) 休 卢 结束， 结束 于 : 16-22-06 22:22:22 
loop finished at: 16-22-06 22:22:22 
线程 ( 0 ) 休眠 结束 ， 结 束 于 : 16-22-06 22:22:24 
loop finished at: 16-22-06 22:22:24 
--- 所 有 线程 执行 结束 于 : 16-22-06 22:22:24 


由 代码 片段 和 执行 结果 我 们 看 到 ,， 子 类 化 Thread 类 ，MyThread 子 类 的 构造 函数 一 定 要 先 
调用 基 类 的 构造 函数 ， 特 殊 函 数 _call_0 在 子 类 中 ， 名 字 要 改 为 run0)。 在 MyThread 类 中 ， 
加 入 一 些 用 于 调试 的 输出 信息 ,把 代码 保存 到 MyThread 模块 中 ,并 导入 这 个 类 。 使 用 self.func() 
函数 运行 这 些 函数 ， 并 把 结果 保存 到 实现 的 selfres 属性 中 ， 创 建 一 个 新 函数 getResult() 得 到 
结果 。 


13.5 ”线程 同步 


如 果 多 个 线程 共同 修改 某 个 数据 ， 就 可 能 出 现 不 可 预料 的 结果 。 为 了 保证 数据 的 正确 性 ， 
需要 对 多 个 线程 进行 同步 。 

使 用 Thread 对 象 的 Lock 和 RLock 可 以 实现 简单 的 线程 同步 , 这 两 个 对 象 都 有 acquire 方 
法 和 release 方法 。 对 于 每 次 只 允许 一 个 线程 操作 的 数据 ， 可 以 将 操作 放 到 acquire 和 release 
方法 之 间 。 

多 线程 的 优势 在 于 可 以 同时 运行 多 个 任务 ， 但 当 线程 需要 共享 数据 时 ， 可 能 存在 数据 不 
同步 的 问题 。 

考虑 这 样 一 种 情况 : 一 个 列表 里 所 有 元 素 都 是 0， 线 程 set 从 后 向 前 把 所 有 元 素 改 成 1， 
而 线程 print 负责 从 前 往 后 读 取 列表 并 输出 。 

线程 set 开始 改 的 时 候 ， 线 程 print 可 能 就 来 输出 列表 了 ， 输 出 就 成 了 一 半 0 一 半 1， 这 就 
是 数据 不 同步 的 问题 。 为 了 避免 这 种 情况 ， 引 入 了 锁 的 概念 。 

锁 有 两 种 状态 一 一 锁定 和 未 锁定 。 当 一 个 线程 (如 set) 要 访问 共享 数据 时 ， 必 须 先 获得 
锁定 ; 如 果 已 经 有 别 的 线程 (如 print) 获得 锁定 了 ， 就 让 线程 set 暂停 ， 也 就 是 同步 阻塞 ; 等 
到 线程 print 访问 完毕 ， 释 放 锁 以 后 ， 再 让 线程 set 继续 。 

经 过 这 样 的 处 理 ， 输 出 列表 时 要 么 全 部 输出 0， 要 么 全 部 输出 1， 不 会 再 出 现 一 半 0 一 半 
1 的 尴 诊 场面 。 


W262. 
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示例 代码 如 下 : 


#! /usr/bin/python 
#-*-coding:UTF-8-*- 


import threading 
from time import sleep 
from datetime import datetime 


date_time format ='%y-%M-%d %H:%M:%S' 


class MyThread (threading.Thread): 
def _init_ (self, threadID, name, counter): 
threading.Thread. init_ (self) 
self.threadID = threadID 
selfname = name 
self.counter = counter 


def run(self): 
print ("开启 线程 : "+ self.name) 
# 获取 锁 ， 用 于 线程 同步 
threadLock.acquire() 
Print_time(self.name, self.counter, 3) 
# 释放 锁 ， 开 启 下 一 个 线程 
threadLock.release() 


def date_time_str(date_time): 
return datetime.strftime(date_time, date_time_format) 


def print_time(threadName, delay, counter): 
while counter: 
sleep(delay) 
Print ("%s: %s" % (threadName, date_time_str(datetime.now()))) 


counter -= 1 


def main(): 
# 创建 新 线程 
threadl = MyThread(1, "Thread-1", 1) 
thread2 = MyThread(2, "Thread-2", 2) 


# 开启 新 线程 
thread1 .start() 
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thread2.start() 


# 添加 线程 到 线程 列表 
threads.append(thread1) 
threads.append(thread2) 


# 等 待 所 有 线程 完成 
for t in threads: 
tjoin() 
print(" 退 出 主线 程 ") 
if_name ==" main 
threadLock = threading.Lock() 
threads = [] 
main() 
执行 结果 如 下 : 
开启 线程 : Thread-1 
开启 线程 : Thread-2 
Thread-1: 16-15-06 23:15:25 
Thread-1: 16-15-06 23:15:26 
Thread-1: 16-15-06 23:15:27 
Thread-2: 16-15-06 23:15:29 
Thread-2: 16-15-06 23:15:31 
Thread-2: 16-15-06 23:15:33 
退出 主线 程 


由 执行 结果 看 到 ， 程 序 正确 得 到 了 同步 效果 。 


13.6 ”线程 优先 级 队列 


Queue 模块 可 以 用 来 进行 线程 间 的 通信 ， 让 各 个 线程 之 间 共 享 数据 。 

Python 的 Queue 模块 提供 了 同步 、 线 程 安全 的 队列 类 , 包括 FIFO (先入 先 出 ) 队 列 Queue、 
LIFO (后 入 先 出 ) 队列 LifoQueue 和 优先 级 队列 PriorityQueue。 这 些 队列 都 实现 了 锁 原 语 ， 能 
够 在 多 线程 中 直接 使 用 。 可 以 使 用 队列 实现 线程 间 的 同步 。 

Queue 模块 中 的 常用 方法 如 表 13-1 所 示 。 
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表 13-1 Queue 模 块 中 的 常用 方法 


























方法 名 描述 

qsize() 返回 队列 的 大 小 

empty0 如 果 队 列 为 室 ， 返 回 Tue， 反 之 返回 False 
full() 如 果 队 列 满 了 ， 返 回 Tue， 反 之 返回 False 
full 与 MaxSize 大 小 对 应 

get([block[, timeout]]) 获取 队列 ，timeout 等 待 时 间 

get_nowait() 相当 于 Queue.get(False) 

put(timeout) 写 入 队列 ，timeout 等 待 时 间 
put_nowait(item) 相当 于 Queue.put(item, False) 





task_done() 


在 完成 一 项 工作 后 ， 函 数 向 已 经 完成 的 队列 发 送 一 个 信号 








join0 





实际 上 意味 着 等 到 队列 为 空 ， 再 执行 别 的 操作 


下 面 通过 以 下 示例 了 解 其 中 一 些 方法 的 使 用 。 


#! /usr/bin/python 
# -*-coding:UTF-8-*- 


import threading 
import queue 
from time import sleep 


class MyThread (threading.Thread): 
def init_ (self, threadID, name, q): 
threading.Thread. init (self) 
self.threadID = threadID 
selfname = name 


selfq=q 


def run(self): 
print ("开启 线程 : " + selfname) 
process_data(selfname, self.q) 


print ("退出 线程 : "+ self.name) 


def process_data(threadName, q): 
while not exitFlag: 
queueLock.acquire() 
if not workQueue.empty(): 
data = q.get() 
queueLock.release() 
Print ("%s processing %s" % (threadName, data)) 


285 ， | 
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else: 
queueLock.release() 
sleep(1) 


def main(): 
global exitFlag 
exitFlag= 0 
threadList = ["Thread-1", "Thread-2", "Thread-3"] 
nameList = ["One", "Two", "Three", "Four", "Five"] 


threads =[] 
threadID = 1 


# 创建 新 线程 
for tName in threadList: 
thread = MyThread(threadID, tName, workQueue) 
thread.start() 
threads.append(thread) 
threadID += 1 


# 填充 队列 

queueLock.acquire() 

for word in nameList: 
workQueue.put(word) 

queueLock.release() 


# 等 待 队列 清空 
while not workQueue.empty(): 
pass 


# 通知 线程 是 退出 的 时 候 了 
exitFlag= 1 


# 等 待 所 有 线程 完成 
for tin threads: 
tjoin() 

print ("退出 主线 程 ") 
if_name ==" main _": 

queueLock = threading.Lock() 
workQueue = queue.Queue(10) 
main() 
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执行 结果 如 下 : 

开启 线程 : Thread-1 
开启 线程 : Thread-2 
开启 线程 : Thread-3 
Thread-3 processing One 
Thread-2 processing Two 
Thread-1 processing Three 
Thread-3 processing Four 
Thread-1 processing Five 
退出 线程 : Thread-3 
退出 线程 : Thread-1 
退出 线程 : Thread-2 
退出 主线 程 


13.7 ”线程 与 进程 比较 


多 进程 和 多 线程 是 实现 多 任务 最 常用 的 两 种 方式 。 下 面 通过 线程 切换 、 计 算 密集 情况 和 
异步 性 能 3 方面 讨论 一 下 这 两 种 方式 的 优 缺 点 。 

首先 , 要 实现 多 任务 , 我 们 通常 会 设计 Master-Worker 模式 , Master 负责 分 配 任 务 , Worker 
负责 执行 任务 。 因 此 ， 在 多 任务 环境 下 ， 通 常 是 一 个 Master、 多 个 Worker。 

如 果 用 多 进程 实现 Master-Worker， 主 进程 就 是 Master， 其 他 进程 就 是 Worker。 

如 果 用 多 线程 实现 Master-Worker， 主 线程 就 是 Master， 其 他 线程 就 是 Worker。 

多 进程 模式 最 大 的 优点 是 稳定 性 高 ， 因 为 一 个 子 进程 衣 溃 不 会 影响 主 进程 和 其 他 子 进程 

(当然 ， 主 进程 挂 了 所 有 进程 就 全 挂 了 ， 但 是 Master 进程 只 负责 分 配 任务 ， 挂 掉 的 概率 低 ) 。 
著名 的 Apache 最 早 就 采用 多 进程 模式 。 

多 进程 模式 的 缺点 是 创建 进程 的 代价 大 。 在 UNIX/Linux 系统 下 用 fork 调用 还 行 ， 在 
Windows 下 创建 进程 开销 非常 大 。 另 外 ， 操 作 系 统 能 同时 运行 的 进程 数 有 限 ， 在 内 存 和 CPU 
的 限制 下 ， 如 果 几 千 个 进程 同时 运行 ， 操 作 系统 就 连 调度 都 会 出 问题 。 

多 线程 模式 通常 比 多 进程 快 一 点 ， 但 是 也 快 不 了 多 少 。 多 线程 模式 致命 的 缺点 是 任何 一 
个 线程 挂 掉 都 可 能 直接 造成 整个 进程 崩溃 ， 因 为 所 有 线程 共享 进程 的 内 存 。 在 Windows 中 ， 
如 果 一 个 线程 执行 的 代码 出 了 问题 ， 就 可 以 看 到 这 样 的 提示 : “该 程序 执行 了 非法 操作 ， 即 将 
关闭 ”， 其 实 往往 是 某 个 线程 出 了 问题 ， 但 是 操作 系统 会 强制 结束 整个 进程 。 

在 Windows 中 ， 多 线程 的 效率 比 多 进程 高 ， 所 以 微软 的 IIS 服务 器 默认 采用 多 线程 模式 。 
由 于 多 线程 存在 稳定 性 的 问题 ， 因 此 IIS 的 稳定 性 不 如 Apache。 为 了 缓解 这 个 问题 ，HS 和 
Apache 有 了 多 进程 + 多 线程 的 混合 模式 ， 问 题 越 来 越 复杂 。 


13.7.1 ”线程 切换 
无 论 是 多 进程 还 是 多 线程 ， 数 量 太 多 ， 效 率 肯定 上 不 去 。 
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我 们 打 个 比方 ， 你 正在 准备 中 考 ， 每 天 晚上 需要 做 语文 、 数 学 、 英 语 、 物 理 、 化 学 5 科 
作业 ， 每 科 作 业 耗 时 1 小 时 。 

如 果 你 先 花 1 小 时 做 语文 作业 ， 做 完 后 再 花 1 小 时 做 数学 作业 ， 这 样 依次 全 部 做 完 ， 一 
共 花 5 小时， 这 种 方式 称 为 单 任务 模型 或 批 处 理 任务 模型 。 

如 果 你 打算 切换 到 多 任务 模型 ， 可 以 先 做 1 分 钟 语文 ， 切 换 到 数学 作业 做 1 分 钟 ， 再 切 
换 到 英语 ， 以 此 类 推 ， 只 要 切换 速度 足够 快 ， 这 种 方式 就 和 单 核 CPU 执行 多 任务 一 样 了 。 以 
幼儿 园 小 朋友 的 眼光 来 看 ， 你 就 正在 同时 写 5 科 作业 。 

不 过 切换 作业 是 有 代价 的 ， 比 如 从 语文 切换 到 数学 ， 要 先 收拾 桌子 上 的 语文 书本 、 钢 笔 

(保存 现场 ) ， 然 后 打开 数学 课本 ， 找 出 圆规 直 尺 〈 准 备 新 环境 ) ， 才 能 开始 做 数学 作业 。 操 
作 系 统 在 切换 进程 或 线程 时 也 一 样 ， 需 要 先 保存 当前 执行 的 现场 环境 (CPU 寄存 器 状态 、 内 
存 页 等 ) ， 然 后 把 新 任务 的 执行 环境 准备 好 《〈 恢 复 上 次 的 寄存 器 状态 ， 切 换 内 存 页 等 ) ， 才 能 
开始 执行 。 这 个 切换 过 程 虽然 很 快 ， 但 是 也 需要 耗费 时 间 。 如 果 有 几 千 个 任务 同时 进行 ， 操 作 
系统 可 能 主要 忙 着 切换 任务 ， 根 本 没有 多 少时 间 执 行 任务 。 这 种 情况 最 常见 的 就 是 硬盘 狂 响 、 
点 窗口 无 反应 ， 这 时 系统 处 于 假死 状态 。 

所 以 ， 多 任务 一 旦 多 到 一 个 限度 ， 就 会 消耗 系统 所 有 资源 ， 导 致 效率 急剧 下 降 ， 所 有 任 
务 都 做 不 好 。 


13.7.2 ”计算 密集 型 与 IO 密集 型 


是 否 采 用 多 任务 的 第 二 个 考虑 是 任务 类 型 ,我 们 可 以 把 任务 分 为 计算 密集 型 和 IO 密集 型 。 

计算 密集 型 任务 的 特点 是 要 进行 大 量 计算 ， 消耗 CPU 资源 ， 如 计算 圆周 率 、 对 视频 进行 
高 清 解 码 等 ， 全 靠 CPU 的 运算 能 力 。 计 算 密 集 型 任务 虽然 可 以 用 多 任务 完成 , 但 是 任务 越 多 ， 
花 在 任务 切换 的 时 间 就 越 多 ，CPU 执行 任务 的 效率 就 越 低 。 要 最 高 效 地 利用 CPU， 计 算 密 集 
型 任务 同时 进行 的 数量 应 当 等 于 CPU 的 核心 数 。 

由 于 计算 密集 型 任务 时 主要 消耗 CPU 资源 ， 因 此 代码 运行 效率 至 关 重 要 。Python 脚本 语 
言 运行 效率 很 低 ， 完 全 不 适合 计算 密集 型 任务 。 计 算 密集 型 任务 最 好 用 C 语言 编写 。 

涉及 网 络 、 磁 盘 IO 的 任务 都 是 IO 密集 型 任务 ， 这 类 任务 的 特点 是 CPU 消耗 很 少 ， 任 务 
的 大 部 分 时 间 都 在 等 待 IO 操作 完成 (因为 IO 的 速度 远 远 低 于 CPU 和 内 存 的 速度 ) 。IO 密集 
型 任务 的 任务 越 多 ，CPU 效率 越 高 ， 不 过 有 一 个 限度 。 大 部 分 任务 都 是 IO 密集 型 任务 ， 如 
Web 应 用 。 

IO 密集 型 任务 执行 期 间 ，99% 的 时 间 都 花 在 IO 上 ， 花 在 CPU 上 的 时 间 很 少 ， 因 此 用 运 
行 速度 极 快 的 C 语言 蔡 换 Python 这 样 运行 速度 极 低 的 脚本 语言 完全 无 法 提升 运行 效率 。 对 于 
IO 密集 型 任务 而 言 ， 最 适合 的 语言 是 开发 效率 高 (代码 量 最 少 ) 的 语言 ， 脚 本 语言 是 首选 ，C 
语言 最 差 。 


13.7:3， :异步 10 


考虑 到 CPU 和 IO 之 间 速 度 差异 很 大 ， 一 个 任务 在 执行 的 过 程 中 大 部 分 时 间 都 在 等 待 IO 
操作 , 单 进程 单线 程 模型 会 导致 别 的 任务 无 法 并 行 执行 , 因此 需要 多 进程 模型 或 多 线程 模型 支 
持 多 任务 并 发 执行 。 
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现在 的 操作 系统 对 IO 操作 已 经 做 了 很 大 改进 , 最 大 的 特点 是 支持 异步 IO。 如 果 充 分 利用 
操作 系统 提供 的 异步 IO 支持 ， 就 可 以 用 单 进程 单线 程 模 型 执行 多 任务 ， 这 种 全 新 模型 称 为 事 
件 驱 动 模型 。Nginx 就 是 支持 异步 IO 的 Web 服务 器 ， 在 单 核 CPU 上 采用 单 进程 模型 就 可 以 
高 效 支持 多 任务 ; 在 多 核 CPU 上 可 以 运行 多 个 进程 (数量 与 CPU 核心 数 相同 ) ， 充 分 利用 多 
核 CPU。 由 于 系统 总 的 进程 数量 十 分 有 限 ， 因 此 操作 系统 调度 非常 高 效 。 用 异步 IO 编程 模型 
实现 多 任务 是 主要 趋势 。 

对 应 到 Python 语言 ， 单 进程 的 异步 编程 模型 称 为 协 程 。 有 了 协 程 的 支持 ， 可 以 基于 事件 
驱动 编写 高 效 的 多 任务 程序 。 


13.8 调 试 


在 多 线程 的 调试 过 程 中 ， 可 能 无 论 怎么 努力 地 找 不 到 问题 所 在 。 即 使 最 好 的 程序 员 偶尔 也 
会 卡 住 。 有 时 候 在 一 段 程序 上 工作 太 久 了 反而 看 不 到 错误 ， 这 时 可 能 需要 从 新 的 角度 审视 问题 。 

当然 ， 在 找到 切入 点 之 前 ， 需 要 提前 做 好 准备 工作 。 你 的 程序 应 当 尽 量 简单 ， 并 且 能 够 
使 用 最 小 的 输入 复 现 错误 。 你 应 当 足 够 理解 遇 到 的 问题 ， 并 能 简明 扼要 地 描述 问题 。 

在 寻找 切入 点 时 ， 请 确保 可 以 提供 以 下 信息 : 


(1) 如 果 有 错误 信息 ， 错 误 信 息 是 什么 ， 代 表 程 序 哪 部 分 内 容 ? 

(2) 在 这 个 错误 之 前 ， 你 做 的 最 后 一 件 事情 是 什么 ? 

(3) 你 写 的 最 后 一 段 代码 是 怎样 的 ? 

(4) 失败 的 新 测试 用 例 是 怎样 的 ? 

(5) 目前 你 做 了 哪些 尝试 ， 从 中 得 到 了 什么 ? 

在 寻找 解决 问题 的 方案 时 ， 思 考 如 何 做 才能 找 得 更 快 。 下 次 遇 到 类 似 问题 时 才能 快速 找 
到 最 优 的 解决 办 法 。 

记 住 ， 我 们 的 目标 不 是 让 程序 正确 运行 ， 而 是 学 会 让 程序 在 尽 可 能 短 的 时 间 内 正确 运行 
起 来 ， 并 尽量 少 出 问题 。 


13.9 ”问题 解答 


(1) Python 多 线程 的 效率 怎么 样 ? 

答 : Python 有 全 锁 局 的 存在 〈 同 一 时 间 只 能 有 一 个 线程 执行 ) ， 并 不 能 利用 多 核 优势 。 
如 果 你 的 多 线程 进程 是 CPU 密集 型 的 ， 多 线程 就 不 能 带 来 效率 的 提升 ， 相 反 还 可 能 因为 线程 
的 频繁 切换 导致 效率 下 降 。 如 果 是 IO 密集 型 ， 多 线程 进程 就 可 以 利用 IO 阻塞 等 待 时 的 空闲 
时 间 执 行 其 他 线程 ， 从 而 提升 效率 。 
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(2) 既然 Python 解释 器 是 单线 程 的 ， 还 有 进行 多 线程 编程 的 必要 吗 ? 

答 : 多 线程 最 开始 不 是 用 来 解决 多 核 利 用 率 问题 的 ， 而 是 用 来 解决 IO 占用 时 CPU 闲置 
的 问题 。 

多 线程 可 以 用 来 解决 阻塞 问题 ， 可 以 做 事件 响应 机 制 〈 或 者 类 似 信号 模 的 问题 ) 。 如 果 
运行 瓶颈 不 是 在 CPU 运算 而 是 在 IO 〈 网 络 ) 上 ， 多 线程 显然 很 划算 。 

能 产生 IO 阻塞 的 情况 很 多 ， 如 网 络 、 磁 盘 等 。 当 发 生 阻 塞 时 ，Python 是 不 耗 CPU 的 ， 
此 时 如 果 只 有 一 个 线程 就 没 法 处 理 其 他 事情 了 .对 于 有 IO 阻塞 的 环境 ,多 线程 可 能 让 你 的 CPU 
跑 到 100% 。 

另 一 个 用 处 来 自 于 Python 的 C 扩展 模块 。 在 扩展 模块 里 可 以 释放 GIL。 释 放 GIL 期 间 不 
应 该 调用 任何 Python API。 对 于 一 些 非常 繁重 的 计算 ， 可 以 写成 C 模块 ， 计 算 前 释放 GIL， 
计算 后 重新 申请 GIL, 并 将 结果 返回 给 Python。 这 样 就 可 以 让 Python 进程 利用 更 多 CPU 资源 。 
每 个 Python 线程 都 是 OS 级 别 Pthread 的 线程 。 利 用 Python 管理 这 些 线程 比 在 C 层级 操作 


Pthread 更 方便 。 





13.10” 温 故 知 新 ， 学 以 致 用 


本 章 主要 讲述 了 正则 表达 式 的 相关 知识 ， 在 本 章 结束 前 回顾 一 下 学 到 的 概念 。 
(1) 线程 和 进程 是 怎么 定义 的 ? 
(2) 线程 如 何 使 用 ， 它 提供 了 哪些 模块 供 我 们 调用 ? 
(3) 线程 同步 和 优先 级 队列 如 何 实 现 ? 
思考 并 解决 如 下 问题 : 
利用 本 章 所 学 ， 并 查阅 相关 资料 ， 实 现 生产 者 -消费 者 模型 。 
生产 者 -消费 者 模型 解释 : 
假设 有 一 个 公共 队列 ， 生 产 者 向 队列 中 写 数据 ， 消 费 者 从 队列 中 读数 据 。 当 队列 中 没有 
任何 数据 时 ， 消 费 者 应 该 停止 运行 并 等 待 (wait) ， 而 不 是 继续 尝试 读 取 数 据 ， 从 而 引发 读 取 
室 队 列 的 异常 。 当 生产 者 在 队列 中 加 入 数据 后 ， 应 该 有 一 个 渠道 告诉 Cnotify) 消费 者 。 消 费 
者 可 以 再 次 从 队列 中 读 取 ， 而 IndexError 不 再 出 现 。 
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忆 全 证 发 送 和 接收 电子 邮件 


邮件 是 我 们 日 常 工作 中 主要 的 沟通 媒介 之 一 。 目 前 几乎 
所 有 编程 语言 都 支持 发 送 和 接收 电子 邮件 。 
本 章 将 介绍 如 何 使 用 Python 语言 发 送 和 接收 邮件 。 
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14.1 电子 邮件 介绍 


Email〈 电 子 邮件 ) 的 历史 比 Web 还 要 久远 。 直 到 现在 ，Email 还 是 互联 网 上 应 用 非常 广 
泛 的 服务 。 

在 我 们 开始 编写 邮件 操作 的 相关 代码 之 前 , 先 了 解 一 下 电子 邮件 在 互联 网 上 是 如 何 运作 的 。 

电子 邮件 其 实 是 我 们 现实 生活 中 快递 的 电子 化 ， 现 实 中 快递 是 怎么 处 理 的 呢 ? 比如 你 在 
上 海 ， 要 邮寄 一 份 文件 给 北京 的 朋友 。 

首先 需要 准备 好 邮寄 的 文件 ， 选 择 一 家 快递 公司 〈 一 般 是 上 门 取 件 或 到 代理 点 投递 ) ， 
快递 公司 会 提供 对 应 的 信封 ， 在 信封 上 填写 地 址 ， 剩 下 的 事 就 由 快递 公司 处 理 了 。 

快递 公司 会 将 一 个 地 点 的 信件 从 就 近 的 小 代理 点 汇聚 到 一 个 快递 中 心 ， 再 从 快递 中 心 往 
别 的 城市 发 , 比如 先 发 到 河南 某 城市 的 快递 中 心 , 再 从 该 处 发 往 北京 , 也 可 能 由 上 海 直 达 北 京 ， 
不 过 你 不 用 关心 具体 路 线 ， 只 需要 知道 一 件 事 ， 就 是 信件 走 得 比较 慢 ， 至 少 要 几 天 时 间 。 

信件 到 达 北 京 的 快递 中 心 后 不 会 直接 送 到 朋友 的 手 里 。 快 递 员 为 了 避免 你 的 朋友 不 在 ， 
而 让 自己 白 跑 一 趟 , 会 将 信件 投递 到 邮件 指定 的 地 址 , 这 个 地 址 可 能 是 你 朋友 居住 附近 的 快递 
箱 、 家 里 或 所 在 公司 。 总 之 ， 当 你 的 朋友 知道 自己 的 信件 已 经 到 达 时 ， 就 可 以 取 到 信件 了 。 

电子 邮件 的 流程 基本 上 是 按 上 面 的 方式 运作 的 ， 只 不 过 速度 不 是 按 天 算 ， 而 是 按 秒 算 。 

现在 回 到 电子 邮件 ， 假 设 自 己 的 电子 邮件 地 址 是 me@163.com， 对 方 的 电子 邮件 地 址 是 
friend@aliyun.com。 用 Outlook 或 Foxmail 之 类 的 软件 写 好 邮件 ， 填 上 对 方 的 Email 地 址 ， 单 
击 “ 发 送 ” 按 钮 , 电子 邮件 就 发 送出 去 了 。 这 些 电子 邮件 被 称 为 邮件 用 户 代理 (Mail User Agent， 
MUA) 。 

Email 从 MUA 发 出 去 后 , 不 是 直接 到 达 对 方 电脑 ， 而 是 发 到 邮件 传输 代理 (Mail Transfer 
Agent, MTA ), 就 是 Email 服务 提供 商 , 如 网 易 、 阿 里 云 等 ,由 于 自己 的 电子 邮件 地 址 是 163.com， 
因此 Email 首先 被 投递 到 网 易 提供 的 MTA， 再 由 网 易 的 MTA 发 送 到 对 方 的 服务 商 ， 也 就 是 
阿里 的 MTA。 在 这 个 过 程 中 可 能 还 会 经 过 别 的 MTA, 但 是 我 们 不 用 关心 具体 路 线 ， 只 关心 速 
度 即 可 。 

Email 到 达 阿 里 的 MTA 后 ， 由 于 对 方 使 用 的 是 @aliyun.com 的 邮箱 ， 因 此 阿里 的 MTA 会 
把 Email 投递 到 邮件 的 最 终 目 的 地 邮件 投递 代理 (Mail Delivery Agent，MDA) 。Email 到 达 
MDA 后 ， 会 存放 在 阿里 云 服务 器 的 某 个 文件 或 特殊 的 数据 库 里 ， 我 们 将 这 个 长 期 保存 邮件 的 
地 方 称 之 为 电子 邮箱 。 

同 普通 邮件 类 似 ，Email 不 会 直接 到 达 对 方 的 电脑 ， 因 为 对 方 的 电脑 不 一 定 开机 ， 开 机 也 
不 一 定 联网 。 对 方 要 取 到 邮件 ， 必 须 通过 MUA 从 MDA 上 获得 。 

- 封 电子 邮件 的 旅程 是 : 
发 件 人 一 MUA 一 MTA 一 MTA 一 若干 个 MTA 一 MDA 一 MUA 一 收 件 人 
了 解 了 上 述 基 本 概念 ， 要 编写 程序 发 送 和 接收 邮件 ， 本 质 就 是 : 


(1) 编写 MUA 把 邮件 发 到 MTA 。 
(2) 编写 MUA 从 MDA 上 收 邮 件 。 
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发 邮件 时 ，MUA 和 MTA 使 用 的 协议 是 SMTP (Simple Mail Transfer Protocol) ， 后 面 的 
MTA 到 另 一 个 MTA 也 是 用 SMTP 协议 。 

收 邮件 时 ，MUA 和 MDA 使 用 的 协议 有 两 种 : 一 种 是 POP (Post Office Protocol) ， 目 前 
版 本 是 3， 俗 称 POP3; 另 一 种 是 IMAP (Internet Message Access Protocol) ， 目 前 版 本 是 4， 
优点 是 不 但 能 取 邮 件 ， 而 且 可 以 直接 操作 MDA 上 存储 的 邮件 ， 如 从 收 件 箱 移 到 垃圾 箱 等 。 

邮件 客户 端 软件 在 发 邮件 时 ,会 让 你 先 配 置 SMTP 服务 器 ， 就 是 要 发 到 哪个 MTA 上 。 假 
设 你 正在 使 用 163 邮箱 ， 就 不 能 直接 发 到 阿里 的 MTA 上 ， 因 为 它 只 服务 于 阿里 的 用 户 ， 所 以 
需要 填写 163 提供 的 SMTP 服务 器 地 址 smtp.163.com。 为 了 证 明 你 是 163 的 用 户 , SMTP 服务 
器 还 要 求 你 填写 邮箱 地 址 和 客户 端 授权 密码 , 这 样 MUA 才能 正常 把 Email 通过 SMTP 协议 发 
送 到 MTA。 

同样 ， 从 MDA 收 邮 件 时 ，MDA 服务 器 也 要 求 验证 你 的 客户 端 授权 密码 ， 确 保 不 会 有 人 
冒充 你 收取 邮件 。 一 般 Outlook 之 类 的 邮件 客户 端 会 要 求 填写 POP3 或 IMAP 服务 器 地 址 、 邮 
箱 地 址 和 授权 密码 。 这 样 ，MUA 才能 顺利 通过 POP 或 IMAP 协议 ， 从 MDA 取 到 邮件 。 

在 使 用 Python 收发 邮件 前 ， 需 要 先 准备 好 至 少 两 个 电子 邮件 ， 如 xxx@163.com， 
xxx@aliyun.com、xxx@qq.com 等 ， 注 意 两 个 邮箱 不 要 用 同一 家 邮件 服务 商 。 

最 后 特别 注意 ， 目 前 大 多 数 邮件 服务 商都 需要 手动 打开 SMTP 发 信和 POP 收 信 功 能 ， 否 
则 只 允许 在 网 页 登录 。 








14.2 发 送 邮 件 


SMTP 是 发 送 邮件 的 协议 ，Python 内 置 对 SMTP 的 支持 ， 可 以 发 送 纯 文本 邮件 、HTML 
邮件 以 及 带 附 件 的 邮件 。 本 节 以 网 易 163 的 服务 为 例 进 行 介绍 。 学 习 本 节 内 容 时 , 可 以 自己 
通 对 应 的 邮箱 服务 , 各 个 邮件 服务 公司 有 介绍 邮箱 服务 的 开通 方法 , 参照 这 些 开通 方法 开通 即 
可 。 如 果 已 经 安装 了 邮箱 服务 ， 就 可 以 使 用 自己 的 邮箱 服务 器 进行 学 习 。 


14.2.1 SMTP 发 送 邮 件 


Python 对 SMTP 的 支持 有 smtplib 和 email 两 个 模块 ，email 负责 构造 邮件 ，smtplib 负责 
发 送 邮 件 。 

简单 邮件 传输 协议 (Simple Mail Transfer Protocol，SMTP) 是 从 源 地 址 到 目的 地 址 传送 邮 
件 的 规则 ， 由 该 协议 控制 信件 的 中 转 方式 。 

Python 的 smtplib 提供 了 一 种 很 方便 的 途径 发 送 电子 邮件 ,对 SMTP 协 议 进 行 了 简单 的 封装 。 

Python 创建 SMTP 对 象 的 语法 如 下 : 


smtpObj = smtplib.SMTP([host [, port [, local hostname]]]) 
语法 中 各 个 参数 说 明 如 下 。 


e@ host: SMTP 服务 器 主机 。 可 以 指定 主机 的 IP 地址 或 域名 (如 www.baidu.com ) ， 是 可 
选 参数 。 
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e@ port: 如 果 提 供 了 host 参数 ， 就 需要 指定 SMTP 服务 使 用 的 端口 号 。 一 般 情况 下 SMTP 


的 端口 号 为 25。 


@ ”local_ hostname: 如 果 SMTP 在 本 地 主机 上 ， 只 需要 指定 服务 器 地 址 为 localhost 即 可 。 
如 果 在 创建 SMTP 对 象 时 提供 了 host 和 port 两 个 参数 ， 在 初始 化 时 会 自动 调用 connect 


方法 连接 服务 器 。 


Python SMTP 对 象 使 用 sendmail 方法 发 送 邮件 的 语法 如 下 : 


SMTP.sendmail(from addr, to_addrs, msg[, mail options, rcpt_options] 

语法 中 各 个 参数 说 明 如 下 。 

e@ from_addr: 邮件 发 送 者 的 地 址 。 

e to_addrs: 字符 串 列 表 ， 邮 件 发 送 地 址 。 

e。 msg: 发 送 消息 。 

msg 是 字符 串 ， 表 示 邮 件 内 容 。 我 们 知道 邮件 一 般 由 标题 、 发 信人 、 收 件 人 、 邮 件 内 容 、 
附件 等 构成 ， 发 送 邮件 时 ， 要 注意 msg 的 格式 。 这 个 格式 就 是 SMTP 协议 中 定义 的 格式 。 

SMTP 类 中 提供 了 表 14-1 所 示 的 一 些 常用 方法 。 


方法 


set_debuglevel(level) 


表 14-1 SMTP 类 的 常用 方法 


描述 
设置 是 否 为 调试 模式 。 默 认为 False， 即 非 调试 模式 ， 表 示 不 输出 任何 调试 信息 





connect([host[, port]]) 


连接 到 指定 的 SMTP 服务 器 。 参 数 分 别 表示 SMPT 主机 和 端口 





docmd(cmd[, argstring]) 


向 SMTP 服务 器 发 送 指令 。 可 选 参数 argstring 表示 指令 的 参数 





helo([hostname]) 


has_extn(name) 


向 服务 器 确认 身份 。 相 当 于 告诉 SMTP 服务 器 “我 是 谁 ” 
判断 指定 名 称 在 服务 器 邮件 列表 中 是 否 存 在 。 出 于 安全 考虑 ，SMTP 服务 器 往往 屏 
项 该 指令 





verify(address) 


判断 指定 邮件 地 址 是 否 在 服务 器 中 存在 。 出 于 安全 考虑 ，SMTP 服务 器 往往 屏蔽 该 
指令 





login(user, password) 


登录 SMTP 服务 器 。 现 在 几乎 所 有 SMTP 服务 器 都 必须 验证 用 户 信息 合法 后 才 允 许 
发 送 邮件 





quitO) 





断 开 与 SMTP 服务 器 的 连接 ， 相 当 于 发 送 quit 指令 


普通 文本 邮件 发 送 的 实现 关键 要 将 MIMEText 中 的 _subtype 设置 为 plain。 首 先导 入 smtplib 
和 mimetext。 创 建 smtplib.smtp 实例 ， 连 接 邮件 SMTP 服务 器 ， 登 录 后 发 送 ， 具 体 代码 如 下 : 


#! /usr/bin/python 


#-*-coding:UTF-8-*- 


import smtplib 


from email.mime.text import MIMEText 
from email.header import Header 
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sender = 'from(@163.com' 
pwd ='xxxxx'# 开 通 邮 箱 服 务 后 ， 设 置 的 客户 端 授权 密码 
Teceivers = [to@aliyun.com'] # 接收 邮件 ， 可 设置 为 你 的 邮箱 


# 三 个 参数 : 第 一 个 为 文本 内 容 ， 第 二 个 plain 设置 文本 格式 ， 第 三 个 utf8 设置 编码 
message = MIMEText(Python 邮件 发 送 测试 …,"plain', utf-8) 

message['From'] = Header(" 邮 件 测 试 ",'utf8) 

message['To] = ”Header(" 测 试 "utf-8) 


subject = 'Python SMTP 邮件 测试 ' 
message['Subject] = Header(subject, "utf-8) 


try: 
# 使 用 非 本 地 服务 器 ， 需 要 建立 ssl 连接 
smtpObj = smtplib.SMTP_SSL("smtp.163.com", 465) 
smtpObj.login(sender, pwd) 
smtpObj.sendmail(sender, receivers, message.as_string()) 
print ("邮件 发 送 成 功 ") 

except smtplib.SMTPException as e: 
print ("Error: 无 法 发 送 邮 件 .Case:%s" % e) 


我 们 使 用 3 个 引号 设置 邮件 信息 。 标 准 邮件 需要 3 个 头 部 信息 : From、To 和 Subject。 每 
个 信息 直接 使 用 空 行 分 割 。 

我 们 通过 实例 化 smtplib 模块 的 SMTP_SSL 对 象 smtpObj 连接 SMTP 访问 ， 并 使 用 
sendmail 方法 发 送信 息 。 

执行 以 上 程序 ， 如 果 你 开通 了 非 本 地 邮件 服务 ， 就 会 输出 : 

邮件 发 送 成 功 

如 果 本 地 主机 安装 了 sendmail 服务 ， 发 送 邮 件 的 代码 可 以 更 改 为 : 


sender = 'from(@163.com' 
receivers = [to@aliyun.com'] # 接收 邮件 ， 可 设置 为 你 的 邮箱 


# 三 个 参数 : 第 一 个 为 文本 内 容 ， 第 二 个 plain 设置 文本 格式 ， 第 三 个 utf8 设置 编码 
message = MIMEText(Python 邮件 发 送 测试 ..…, 'plain', utf-8) 

message['From'] = Header(" 邮 件 测试 ", "utf-8") 

message['To] = ”Header(" 测 试 ", 'utf-8') 


subject = 'Python SMTP 邮件 测试 ' 
message['Subject] = Header(subject "utf-8") 


try: 
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smtpObj = smtplib.SMTP("localhost") 
smtpObj.sendmail(sender, receivers, message.as_string()) 
print ("邮件 发 送 成 功 ") 

except smtplib.SMTPException as e: 
print ("Error: 无 法 发 送 邮 件 .Case:%s" % e) 


不 需要 客户 端 授权 密码 、SSL 连接 和 登录 服务 。 
根据 示例 蔡 换 相应 的 授权 密码 、SSL 连接 和 登录 服务 后 ， 本 地 执行 效果 如 图 14-1 所 示 。 





yuzhouliu 


this is a email test, don't reply. 





图 14-1 普通 邮件 发 送 效 果 
14.2.2 发送 HTML 格式 的 邮件 


如 果 我 们 要 发 送 的 是 HTML 邮件 ， 而 不 是 普通 的 纯 文 本 文件 怎么 办 呢 ? 方法 很 简单 ， 在 
构造 MIMEText 对 象 时 把 HTML 字符 串 传 进去 ， 再 把 第 二 个 参数 由 plain 变 为 html 就 可 以 了 。 
代码 实现 如 下 : 

#! /usr/bin/python 

#-*-coding:UTF-8-*- 


import smtplib 
from email.mime.text import MIMEText 
from email.header import Header 


sender = ' 位 om@163.comy' 

pwd = 'xXxXxXX'# 开 通 邮箱 服务 后 ， 设 置 的 客户 端 授权 密码 
receivers = [to@aliyun.com'] # 接收 邮件 ， 可 设置 为 你 的 邮箱 
mail msg=""" 

<p>Python 邮件 发 送 测 试 ...</p> 

<p><a href="http://www.runoob.com"> 这 是 一 个 链接 </a></p> 
message = MIME Text(mail_msg, ‘html', utf-8) 
message['From'] = Header(" 邮 件 测试 ", "utf-8') 

Imessage['To] = ”Header(" 测 试 ", 'utf-8') 
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subject = 'Python SMTP 邮件 测试 ' 
message['Subject] = Header(subject, "utf-8) 


try: 
# 使 用 非 本 地 服务 器 ， 需 要 建立 ssl 连接 
smtpObj = smtplib.SMTP_SSL("smtp.163.com", 465) 
smtpObj.login(sender, pwd) 
smtpObj.sendmail(sender, receivers, message.as_string()) 
print ("邮件 发 送 成 功 ") 

except smtplib.SMTPException as e: 
print ("Error: 无 法 发 送 邮件 .Case:%s" % e) 


执行 以 上 程序 ， 如 果 你 开通 了 非 本 地 邮件 服务 ， 就 会 输出 : 
邮件 发 送 成 功 
如 果 本 地 主机 安装 了 sendmail 服务 ， 就 不 需要 客户 端 授权 密码 、SSL 连接 和 登录 服务 ， 


直接 使 用 smtplib 模块 的 SMTP 对 象 连接 本 地 访问 即 可 。 
14.2.3 ”发 送 带 附件 的 邮件 


如 果 Email 中 要 添加 附件 怎么 办 ? 
带 附 件 的 邮件 可 以 看 作 包 含 文本 和 各 个 附件 ， 可 以 构造 一 个 MIMEMultipart 对 象 代表 邮 


件 本 身 ， 然 后 往 里 面 添加 一 个 MIMEText 作为 邮件 正文 ， 再 添加 表示 附件 的 MIMEBase 对 象 
即 可 。 代 码 实 现 如 下 : 


#! /usr/bin/python 
#-*-coding:UTF-8-*- 


import smtplib 

from email.mime.text import MIMEText 

from email.mime.multipart import MIMEMultipart 
from email.header import Header 


sender = ' 位 om@163.comy' 
pwd = 'xxXxxx'# 开 通 邮箱 服务 后 ， 设 置 的 客户 端 授权 密码 
receivers = [to@aliyun.com'] # 接收 邮件 ， 可 设置 为 你 的 邮箱 


# 创 建 一 个 带 附件 的 实例 

message = MIMEMultipartO 

message['From'] = Header(" 邮 件 测试 ", "utf-8') 
message['To'] = ”Header(" 测 试 ", 'utf-8') 
subject = 'Python SMTP 邮件 测试 ' 
message['Subject] = Header(subject, "utf-8") 
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# 邮 件 正文 内 容 
message.attach(MIMEText(' 这 是 Python 邮件 发 送 测 试 ……', 'plain', "utf-8')) 


# 构造 附件 1， 传 送 当前 目录 下 的 testtxt 文件 

attl = MIMEText(open(test.txt, rb).read0, 'base64', utf-8) 
attl["Content-Type"] ='application/octet-stream' 

# 这 里 的 filename 可 以 任意 写 ， 写 什么 名 字 ， 邮 件 中 就 显示 什么 名 字 
att1["Content-Disposition "] = 'attachment filename="test.txt"" 
message.attach(att1) 


# 构造 附件 2， 传送 当前 目录 下 的 runoob.txt 文件 

att2 = MIMEText(open(runoob.txt, 'rb').read(), 'base64', "utf-8") 
att2["Content-Type"] = 'application/octet-stream’ 
att2["Content-Disposition"] = 'attachment; filename="runoob.txt"" 
message.attach(att2) 


try: 
# 使 用 非 本 地 服务 器 ， 需 要 建立 ssl 连接 
smtpObj = smtplib.SMTP_SSL("smtp.163.com", 465) 
smtpObj.login(sender, pwd) 
smtpObj.sendmail(sender, receivers, message.as_string()) 
print ("邮件 发 送 成 功 ") 

except smtplib.SMTPException as e: 
print ("Error: 无 法 发 送 邮 件 .Case:%s" % e) 


执行 以 上 程序 ， 如 果 你 开通 了 非 本 地 邮件 服务 ， 就 会 输出 : 

邮件 发 送 成 功 

如 果 本 地 主机 安装 了 sendmail 服务 ， 就 不 需要 客户 端 授权 密码 、SSL 连接 和 登录 服务 ， 
直接 使 用 smtplib 模块 的 SMTP 对 象 连接 本 地 访问 即 可 。 
14.2.4 ”发 送 图 片 


如 果 要 把 一 个 图 片 嵌入 邮件 正文 , 怎么 做 呢 ? 是 否 可 以 直接 在 HTML 邮件 中 链接 图 片 地 址 ? 

大 部 分 邮件 服务 商都 会 自动 屏蔽 带 有 外 链 的 图 片 , 因为 不 知道 这 些 链接 是 否 指向 恶意 网 站 。 

要 把 图 片 嵌 入 邮件 正文 ， 我 们 只 需 按照 发 送 附件 的 方式 把 邮件 作为 附件 添加 进去 ， 然 后 
在 HTML 中 通过 引用 sre="cid:0" 把 附件 作为 图 片 嵌入 。 如 果 有 多 张 图 片 ， 就 需要 给 它们 依次 
编号 ， 然 后 引用 不 同 的 cid:x。 

#! /usr/bin/python 

#-*-coding:UTF-8-*- 
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import smtplib 

from email.mime.image import MIMEImage 

from email.mime.multipart import MIMEMultipart 
from email.mime.text import MIMEText 

from email.header import Header 


sender = 'from(@163.com' 
pwd = 'xxxxx'# 开 通 邮 箱 服务 后 ， 设 置 的 客户 端 授 权 密 码 
receivers = [to@aliyun.com'] # 接收 邮件 ， 可 设置 为 你 的 邮箱 


msgRoot = MIMEMultipart('related') 
msgRoot[From'] = Header(" 邮 件 测试 ", 'utf-8') 
msgRoot['To] = ”Header(" 测 试 ", "utf-8') 
subject = 'Python SMTP 邮件 测试 ' 
msgRoot['Subject] = Header(subject, "utf-8') 


msgAlternative = MIMEMultipart('alternative') 
msgRoot.attach(msgAlternative) 


mail msg=""" 

<p>Python 邮件 发 送 测试 …</p> 

<p><a href="https://www.python.org">Python 官方 网 站 </a></p> 
<p> 图 片 演示 : </p> 

<p><img src="cid:imagel"></p> 


mm 


msgAlternative.attach(MIME Text(mail_msg, ‘html', "utf-8")) 


# 指定 图 片 为 当前 目录 

fp = open('test.png', 'rb') 
msgImage= MIMEImage(fph.read()) 
印 .close0) 


# 定义 图 片 DD， 在 HTML 文本 中 引用 
msglmage.add_header('Content-ID', ‘<imagel>') 
msgRoot.attach(msgImage) 


try: 
# 使 用 非 本 地 服务 器 ， 需 要 建立 ssl 连接 
smtpObj = smtplib.SMTP_SSL("smtp.163.com", 465) 
smtpObj.login(sender pwd) 
smtpObj.sendmail(sender, receivers, msgRoot.as_string()) 


print ("邮件 发 送 成 功 ") 
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except smtplib.SMTPException as e: 
print ("Error: 无 法 发 送 邮 件 .Case:%s" % e) 


执行 以 上 程序 ， 如 果 你 开通 了 非 本 地 邮件 服务 ， 就 会 输出 : 
邮件 发 送 成 功 


如 果 本 地 主机 安装 了 sendmail 服务 ， 就 不 需要 客户 端 授权 密码 、SSL 连接 和 登录 服务 ， 
直接 使 用 smtplib 模块 的 SMTP 对 象 连接 本 地 访问 即 可 。 


14.2.5 同时 支持 HTML 和 Plain 格式 


如 果 我 们 发 送 HTML 邮件 ， 收 件 人 通过 浏览 器 或 Outlook 之 类 的 软件 就 可 以 正常 浏览 邮 
件 内 容 。 如 果 收 件 人 使 用 的 设备 太古 老 ， 查 看 不 了 HTML 邮件 怎么 办 呢 ? 

办 法 是 在 发 送 HTML 的 同时 附加 一 个 纯 文 本 ， 如 果 收 件 人 无 法 查看 HTML 格式 的 邮件 ， 
就 可 以 自动 降级 查看 纯 文 本 邮件 。 

利用 MIMEMultipart 可 以 组 合 一 个 HTML 和 Plain, 注意 指定 subtype 是 alternative。 使 用 
代码 格式 如 下 : 

#! /usr/bin/python 

#-*-coding:UTF-8-*- 


import smtplib 

from email.mime.image import MIMEImage 

from email.mime.multipart import MIMEMultipart 
from email.mime.text import MIMEText 

from email.header import Header 


sender ='15618942985(@163.com' 
pwd='lyzl11LYZ'# 开 通 邮 箱 服务 后 ， 设 置 的 客户 端 授权 密码 
receivers = [yuzhouliu@aliyun.com'] # 接收 邮件 ， 可 设置 为 你 的 邮箱 


msgRoot = MIMEMultipart(related) 
msgRoot[From'] = Header(" 邮 件 测 试 ", utf-8) 
msgRoot['To] = Header(" 测 试 ",utf8) 
subject = 'Python SMTP 邮件 测试 ' 
msgRoot['Subject] = Header(subject, 'utf-8) 


msgAlternative = MIMEMultipart('alternative) 
msgRoot.attach(msgAlternative) 


msgAlternative.attach(MIME Text('hello', 'plain', ‘utf-8")) 
mail msg='<html><body><h1>Hello</hl></body></html>' 
msgAlternative.attach(MIME Text(mail_msg, ‘html', utf-8)) 


# 指定 图 片 为 当前 目录 


fp = open('test.png', rb) 
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msgImage = MIMEImage(fp.read()) 
印 .close0 


# 定义 图 片 ID, 在 HTML 文本 中 引用 
msgImage.add_header(0Content-ID'，'<imagel>) 
msgRoot.attach(msgImage) 


try: 
# 使 用 非 本 地 服务 器 ， 需 要 建立 ssl 连接 
smtpObj = smtplib.SMTP_SSL("smtp.163.com", 465) 
smtpObj.login(sender pwd) 
smtpObj.sendmail(sender, receivers, msgRoot.as_string()) 
print ("邮件 发 送 成 功 ") 

except smtplib.SMTPException as e: 
print ("Error: 无 法 发 送 邮件 .Case:%s" % e) 


执行 以 上 程序 ， 如 果 你 开通 了 非 本 地 邮件 服务 ， 就 会 输出 : 


邮件 发 送 成 功 
查看 收 到 的 邮件 ， 如 图 14-2 所 示 。 
外- 9” 面 - A ee 





Ta9S 代表 邮件 测 证 
型 二 
Python SMTP 邮件 测试 


共 1 个 理 件 ( [加 att000.jpeg ) 


Hello 


附件 1 个 《2MB 久 附件 中 未 发 现 病毒 ( 举报 附 人 性 











图 14-2 ”接收 带 附件 的 邮件 
14.2.6 加密 SMTP 


使 用 标准 25 端口 连接 SMTP 服务 器 时 使 用 的 是 明文 传输 ,发送 邮件 的 整个 过 程 可 能 会 被 
穿 昕 。 要 更 安全 地 发 送 邮 件 ， 可 以 加 密 SMTP 会 话 ， 实 际 上 是 先 创建 SSL 安全 连接 ， 然 后 使 
用 SMTP 协议 发 送 邮 件 。 

某 些 邮件 服务 商 ( 如 Gmail) 提供 的 SMTP 服务 必须 进行 加 密 传输 。 下 面 来 看 如 何 通 过 
Gmail 提供 的 安全 SMTP 发 送 邮 件 。 
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由 于 Gmail 的 SMTP 端口 是 587， 因 此 修改 代码 如 下 : 


smtp_server = 'smtp.gmail.com' 

smtp_port = 587 

server = smtplib.SMTP(smtp_server, smtp_port) 
server.starttls() 

# 剩 下 的 代码 和 前 面 的 一 模 一样 : 


server.set_debuglevel(1) 


只 需要 在 创建 SMTP 对 象 后 立刻 调用 starttls() 方 法 ,就 可 以 创建 安全 连接 。 后 面 的 代码 和 
前 面 的 发 送 邮件 代码 完全 一 样 。 

如 果 因 为 网 络 问 题 无 法 连接 Gmail 的 SMTP 服务 器 ， 请 相信 我 们 的 代码 是 没有 问题 的 ， 
需要 对 网 络 设置 做 必要 的 调整 。 


14.3 “POP3 接收 邮件 


SMTP 用 于 发 送 邮件 ， 如 果 要 收取 邮件 呢 ? 
收取 邮件 就 是 编写 一 个 MUA 作为 客户 端 ， 从 MDA 获取 邮件 到 用 户 的 电脑 或 手机 上 。 收 
取 邮 件 最 常用 的 协议 是 POP， 目 前 版 本 是 3， 俗称 POP3。 
Python 内 团 了 一 个 poplib 模块 ， 用 于 实现 POP3 协议 ， 可 以 直接 用 来 收取 邮件 。 
注意 POP3 协议 收取 的 不 是 可 以 阅读 的 邮件 ,而 是 邮件 的 原始 文本 。 这 和 SMTP 协议 很 像 ， 
SMTP 发 送 的 也 是 经 过 编码 后 的 一 大 段 文 本 。 
要 把 POP3 收取 的 文本 变 成 可 以 阅读 的 邮件 ， 还 需要 用 email 模块 提供 的 各 种 类 解析 原始 
文本 。 
收取 邮件 分 为 以 下 两 个 步骤 : 
(1) 用 poplib 把 邮件 的 原始 文本 下 载 到 本 地 。 
(2) 用 email 解析 原始 文本 ， 还 原 为 邮件 对 象 。 


14.3.1 POP3 下 载 邮 件 


POP3 协议 很 简单 。 下 面 获取 最 新 一 封 邮 件 的 内 容 ， 代 码 如 下 : 
#! /usr/bin/python 

#-*-coding:UTF-8-*- 

import poplib 


from email.parser import Parser 


# 输入 邮件 地 址 、 口 令 和 POP3 服务 器 地 址 
email = input(Email: ) 


password = input('Password: ) 
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pop3 _server= input(POP3 server: ) 


# 连接 到 POP3 服务 器 

server = poplib.POP3(pop3_server) 

# 可 以 打开 或 关闭 调试 信息 
server.set_debuglevel(1) 

# 可 选 : 输出 POP3 服务 器 的 欢迎 文字 
Print(server.getwelcome(.decode(utf-8)) 
# 身份 认证 

server.user(email) 
server.pass_(password) 


# stat() 返 回 邮件 数量 和 占用 空间 

Print(Messages: %s. Size: %s' % server.stat()) 

# list0) 返 回 所 有 邮件 的 编号 

resp, mails, octets = server.list() 

# 可 以 查看 返回 的 列表 ， 类 似 [b'1 82923', b2 2184', .…] 


print(mails) 
# 获取 最 新 一 封 邮件 , 注意 索引 号 从 1 开始 


index = len(mails) 
resp, lines, octets = server.retr(index) 


# lines 存储 了 邮件 原始 文本 的 每 一 行 

# 可 以 获得 整个 邮件 的 原始 文本 
msg_content = b\i\n'.join(lines).decode("utf-8') 
# 稍 后 解析 邮件 


msg = Parser().parsestr(msg_content) 


# 可 以 根据 邮件 索引 号 直接 从 服务 器 删除 邮件 

# server.dele(index) 

# 关闭 连接 

server.quit() 

用 POP3 获取 邮件 其 实 很 简单 ， 要 获取 所 有 邮件 ， 只 需要 循环 使 用 retr() 把 每 一 封 邮件 的 
内 容 拿 到 即 可 。 真 正 麻烦 的 是 把 邮件 的 原始 内 容 解析 为 可 以 阅读 的 邮件 对 象 。 


14.3.2 解析 邮件 
解析 邮件 的 过 程 和 构造 邮件 正好 相反 ， 需 要 先导 入 必要 的 模块 : 


from email.parser import Parser 
from email.header import decode_header 
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from email.utils import parseaddr 
import poplib 
只 需要 一 行 代码 就 可 以 把 邮件 内 容 解析 为 Message 对 象 : 


msg = Parser().parsestr(msg_content) 


这 个 Message 对 象 可 能 是 一 个 MIMEMultipart 对 象 , 即 包含 罕 套 的 其 他 MIMEBase 对 象 ， 


嵌 套 可 能 还 不 止 一 层 。 
我 们 要 递归 地 输出 Message 对 象 的 层次 结构 : 


# indent 用 于 缩 进 显示 : 
def print_info(msg, indent=0): 
if indent 一 0: 
for header in ['From', 'To', 'Subject]: 
value = msg.get(header, ") 
if value: 
if header——'Subject': 
value = decode_str(value) 
else: 
hdr, addr = parseaddr(value) 
name = decode_str(hdr) 
value = u'%s <%s>' % (name, addr) 
print('%s%s: %s' % (" '* indent, header, value)) 
if (msg.is_multipart()): 
parts = msg.get_payload() 
for n, part in enumerate(parts): 
print('%spart %s' % (" '*indent, n)) 
Print('%s—--—--—--—--—--' "%( '* indent)) 
print_info(part indent + 1) 
else: 
content type = msg.get_content_type() 
if content_type=='text/plain' or content type 一 'textyhtml' 
content = msg.get_payload(decode=True) 
charset = guess_charset(msg) 
if charset: 
content = content.decode(charset) 
print('%sText: %s' % (" '* indent, content+'...')) 
else: 


Print('%sAttachment: %s' % (' '* indent content type)) 


邮件 的 Subject 或 Email 中 包含 的 名 字 都 是 经 过 编码 的 str， 要 正 


码 如 下 : 


常 


显示 


0 


必须 进行 解码 ， 代 
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def decode str(s): 
value, charset = decode_header(s)[0] 
if charset: 
value = value.decode(charset) 
return value 


decode_header() 返 回 一 个 list， 因 为 像 Cc、Bcc 这 样 的 字段 可 能 包含 多 个 邮件 地 址 ， 所 以 
会 解析 出 多 个 元 素 。 编 写 上 面 的 代码 时 偷懒 了 ， 只 取 了 第 一 个 元 素 。 
文本 邮件 的 内 容 也 是 str， 还 需要 检测 编码 ， 和 否则 非 UTF-8 编码 的 邮件 都 无 法 正常 显示 
代码 如 下 : 
def guess_charset(msg): 
charset = msg.get_charset() 
if charset is None: 
content type = msg.get('Content-Type', ").lowerO 
pos = content_type.find('charset=') 
if pos >= 0: 
charset = content_type[pos + 8:].strip() 
return charset 


14.4 调 试 


对 于 电子 邮件 的 编码 ， 初 次 接触 的 开发 者 可 能 会 很 头疼 ， 特 别 是 很 少 使 用 邮件 的 开发 者 。 
如 果 你 在 学 习 过 程 中 产生 了 挫败 和 愤怒 感 ， 请 停 下 来 ， 出 去 散 散 步 或 找 人 闲聊 一 会 儿 ， 当 你 平 
静 下 来 后 再 思考 程序 。 

有 时 找到 一 个 问题 的 解决 办 法 确实 需要 时 间 ， 特 别 是 在 我 们 经 验 不 足 的 时 候 。 很 多 人 是 
在 远离 计算 机 ， 让 头脑 得 到 足够 的 休息 后 ， 找 到 了 更 加 可 行 的 方法 解决 某 些 问题 ， 或 者 理 清 了 
思路 ， 清 楚 自己 接 下 来 该 怎么 做 。 





14.5 ”问题 解答 


在 实际 应 用 开发 中 ， 邮 件 发 送 与 接收 使 用 得 多 吗 ? 

答 : 在 实际 应 用 开发 中 ， 邮 件 的 应 用 非常 广泛 。 计 算 机 应 用 中 ， 我 们 会 设置 很 多 自动 任 
务 或 定时 任务 。 这 些 任 务 执行 成 功 与 否 ,或 者 在 指定 时 间 是 否 执行 ,我 们 一 般 都 是 通过 邮件 将 
执行 结果 发 送 给 相关 人 员 ， 以 便 实 时 了 解 任务 的 执行 情况 。 一 旦 任务 执行 出 现 问题 ， 我 们 可 以 
快速 知晓 , 可 以 将 一 些 关 键 错误 信息 放 在 邮件 中 , 这 样 通过 查看 邮件 就 可 以 快速 排查 一 些 比较 
常见 的 问题 。 
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14.6 温 故 知 新 ， 学 以 致 用 


本 章 主要 讲述 了 正则 表达 式 的 相关 知识 ， 在 本 章 结束 前 回顾 一 下 学 到 的 概念 。 


(1) SMPT 支持 发 送 哪些 类 型 的 邮件 ， 各 自 怎么 实现 ? 
(2) POP3 如 何 接收 与 解析 邮件 ? 


本 章 思考 点 : 
参照 示例 ， 让 自己 的 程序 能 正确 发 送 和 接收 邮件 。 
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5 网络 编程 


Python 是 很 强大 的 网 络 编程 工具 。Python 有 很 多 针对 
常见 网 络 协议 的 库 , 这 些 库 可 以 使 我 们 集中 精力 在 程序 的 届 
辑 处 理 上 ， 而 不 是 停留 在 网 络 实现 的 细节 中 。 使 用 Python 
很 容易 写 出 处 理 各 种 协议 格式 的 代码 , Python 在 处 理 字 节 流 
的 各 种 模式 方面 很 擅长 。 





人 
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15.1 网 络 编程 初 识 


自从 互联 网 诞生 以 来 ， 基 本 上 所 有 程序 都 是 网 络 程序 ， 很 少 有 单机 版 程序 了 。 

计算 机 网 络 把 各 个 计算 机 连接 到 一 起 ， 让 网 络 中 的 计算 机 可 以 互相 通信 。 网 络 编程 在 程 
序 中 实现 了 两 台 计算 机 的 通信 。 

举 个 例子 ， 当 你 使 用 浏览 器 访问 淘宝 网 时 ， 你 的 计算 机 和 淘宝 的 某 台 服务 器 通过 互联 网 
连接 起 来 了 ， 淘 宝 的 服务 器 就 会 把 网 页 内 容 作 为 数据 通过 互联 网 传输 到 你 的 电脑 上 。 

由 于 你 的 电脑 上 可 能 不 止 浏览 器 ， 还 有 微 信 、 办 公 软 件 、 邮 件 客户 端 等 ， 不 同 程序 连接 
的 计算 机 也 会 不 同 ， 因 此 网 络 通信 是 两 台 计 算 机 的 两 个 进程 之 间 的 通信 。 比 如 , 浏览 器 进程 和 
淘宝 服务 器 上 某 个 Web 服务 进程 通信 ， 而 微 信 进程 是 和 腾讯 服务 器 上 某 个 进程 通信 。 

网 络 编程 对 所 有 开发 语言 都 是 一 样 的 ，Python 也 不 例外 。 用 Python 进行 网 络 编程 就 是 在 
Python 程序 的 进程 内 连接 别 的 服务 器 进程 的 通信 端口 进行 通信 。 


15.2 TCPI/IP 简介 


大 家 对 互联 网 应 该 很 熟悉 ， 计 算 机 网 络 的 出 现 比 互联 网 要 早 很 多 。 

为 了 联网 ， 计 算 机 必须 规定 通信 协议 。 早 期 的 计算 机 网 络 都 是 由 各 厂商 自己 规定 一 套 协 
议 ， 如 IBM 和 Microsoft 都 有 各 自 的 网 络 协议 ， 互 不 兼容 。 这 就 好 比 一 群 人 有 的 说 英语 ， 有 的 
说 中 文 ， 有 的 说 德语 ， 但 都 只 懂 一 种 语言 ， 因 此 只 有 说 同一 种 语言 的 人 可 以 交流 ， 说 不 同 语言 
的 人 就 不 行 了 。 

为 了 把 全 世界 所 有 不 同类 型 的 计算 机 都 连接 起 来 ， 必 须 规定 一 套 全 球 通 用 协议 。 为 了 实 
现 互 联网 这 个 目标 ， 大 家 共同 制定 了 互联 网 协议 簇 (Internet Protocol Suite) ， 作 为 通用 协议 
标准 。Internet 是 由 inter 和 net 两 个 单词 组 合 起 来 的 , 原意 是 连接 “网 络 ” 的 网 络 , 有 了 Internet， 
只 要 支持 这 个 协议 ， 任 何 私有 网 络 都 可 以 连 入 互联 网 。 

互联 网 协议 包含 上 百 种 协议 标准 ， 由 于 最 重要 的 两 个 协议 是 TCP 和 卫 协议 ， 因 此 大 家 把 
互联 网 协议 简称 为 TCP/P 协议 。 

通信 时 双方 必须 知道 对 方 的 标识 ， 好 比 发 邮件 必须 知道 对 方 的 邮件 地 址 。 互 联网 上 计算 
机 的 唯一 标识 就 是 IP 地 址 ， 如 192.168.12.27。 如 果 一 台 计 算 机 同时 接 入 两 个 或 更 多 网 络 〈 如 
路 由 器 ) ， 就 会 有 两 个 或 多 个 IP 地 址 ， 所 以 IP 地 址 对 应 的 实际 是 计算 机 的 网 络 接口 ， 通 常 是 
网 卡 。 

IP 协议 负责 把 数据 从 一 台 计 算 机 通过 网 络 发 送 到 另 一 台 计 算 机 。 数 据 被 分 割 成 一 小 块 一 
小 块 ， 然 后 通过 IP 包 发 送出 去 。 由 于 互联 网 链 路 复杂 ， 两 台 计 算 机 之 间 经 常 有 多 条 线路 ， 因 
此 路 由 器 负责 决定 如 何 把 一 个 IP 包 转 发 出 去 。IP 包 的 特点 是 按 块 发 送 ， 途 经 多 个 路 由 ， 但 不 
保证 能 到 达 ， 也 不 保证 按 顺 序 到 达 。 了 P 地 址 实际 上 是 一 个 32 位 整数 (IPv4) ， 以 字符 串 表 示 
的 了 PP 地 址 实际 上 是 把 32 位 整数 按 8 位 分 组 后 的 数字 表示 (如 192.168.0.1), 目的 是 便于 阅读 。 
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IPv6 地 址 实际 上 是 128 位 整数 ， 是 目前 使 用 的 IPv4 的 升级 版 ， 以 字符 串 表示 类 似 于 
2001:0db8:85a3:0042:1000:8a2e:0370:7334。 
TCP 协议 建立 在 IP 协议 之 上 。TCP 协议 负责 在 两 台 计 算 机 之 间 建 立 可 靠 连接 ， 保 证 数据 
包 按 顺序 到 达 。TCP 协议 会 通过 握手 建立 连接 ,然后 对 每 个 IP 包 编 号 , 确保 对 方 按 顺 序 收 到 ， 
如 果 包 丢掉 了 就 自动 重 发 。 
许多 常用 的 更 高 级 的 协议 都 是 建立 在 TCP 协议 基础 上 的 ， 如 用 于 浏览 器 的 HTTP 协议 、 
发 送 邮件 的 SMTP 协议 等 。 
-个 卫 包 除了 包含 要 传输 的 数据 外 ， 还 包含 源 卫 地 址 和 目标 IP 地 址 、 源 端口 和 目标 端口 。 
端口 有 什么 作用 ? 两 台 计 算 机 通信 时 ， 只 发 IP 地 址 是 不 够 的 ， 因 为 同一 台 计算 机 运行 着 
多 个 网 络 程序 。 一 个 IP 包 来 了 之 后 交 给 浏览 器 还 是 微 信 ， 需 要 端口 号 进行 区 分 。 每 个 网 络 程 
序 都 向 操作 系统 申请 唯一 的 端口 号 , 这 样 两 个 进程 在 两 台 计 算 机 之 间 建 立 网 络 连接 就 需要 各 自 
的 IP 地址 和 端口 号 。 
-个 进程 也 可 能 同时 与 多 台 计 算 机 建立 连接 ， 因 此 它 会 申请 很 多 端口 。 





15.3 ”网 络 设计 模块 


前 面 我 们 了 解 了 TCP/IP 协议 、IP 地 址 和 端口 的 基本 概念 ， 下 面 我 们 开始 了 解 网 络 编程 。 
标准 库 中 有 很 多 网 络 设计 模块 ， 除 了 明确 处 理 网 络 事务 的 模块 外 ， 还 有 很 多 模块 是 与 网 
络 相关 的 。 接 下 来 我 们 讨论 其 中 几 个 模块 。 


15.3.1 ”Socket 简介 


网 络 编程 中 有 一 个 基本 组 件 一 一 套 接 字 (socket) 。 

套 接 字 为 特定 网 络 协 议 ( 如 TCP/IP、ICMP/IP、UDP/IP 等 ) 套件 对 上 的 网 络 应 用 程序 提 
供 者 提供 当前 可 移植 标准 的 对 象 。 套 接 字 允许 程序 接收 数据 并 进行 连接 ， 如 发 送 和 接收 数据 。 
为 了 建立 通信 通道 ， 网 络 通信 的 每 个 端点 拥有 一 个 套 接 字 对 象 极 为 重要 。 

套 接 字 为 BSD UNIX 系统 核心 的 一 部 分 , 而 且 被 许多 类 似 UNIX 的 操作 系统 (包括 Linux) 
所 采纳 。 许 多 非 BSD UNIX 系统 (如 MS-DOS、Windows、OS/2，Mac OS 及 大 部 分 主机 环境 ) 
都 以 库 形式 提供 对 套 接 字 的 支持 。 

3 种 最 流行 的 套 接 字 类 型 是 stream、datagram 和 raw。stream 和 datagram 套 接 字 可 以 直接 
与 TCP 协议 进行 接口 ， 而 raw 套 接 字 与 IP 协议 进行 接口 。 套 接 字 并 不 限于 TCP/IP。 

套 接 字 主 要 是 两 个 程序 之 间 的 “信息 通道 ”。 程 序 (通过 网 络 连接 ) 可 能 分 布 在 不 同 的 
计算 机 上 ， 通 过 套 接 字 相互 发 送信 息 。 在 Python 中 ， 大 多 数 网 络 都 隐藏 了 socket 模块 的 基本 
细节 ， 并 且 不 直接 和 套 接 字 交互 。 


15.3.2 ”socket 模块 


套 接 字 横 块 是 一 个 非常 简单 的 基于 对 象 的 接口 , 提供 对 低层 BSD 套 接 字 样式 网 络 的 访问 。 
使 用 该 模块 可 以 实现 客户 机 和 服务 器 套 接 字 。 要 在 Python 中 建立 具有 TCP 和 流 套 接 字 的 简单 
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服务 器 需要 使 用 socket 模块 。 利 用 该 模块 包含 的 函数 和 类 定义 可 生成 通过 网 络 通信 的 程序 。 
一 般 来 说 ， 建 立 服务 器 连接 需要 6 个 步骤 。 

C301 创建 socket 对 象 . 

在 Python 中， 我 们 用 socketO) 函 数 创建 套 接 字 ， 语 法 格式 如 下 : 

socket.socket([family[, type[, protocol]]]) 

e family: 可 以 是 AF_ UNIX (UNIX 域 ， 用 于 同一 台 机 器 上 的 进程 问 通信 ) ， 也 可 以 是 

AF_INET (对 于 IPV4 协议 的 TCP 和 UDP) 或 AF_INET6 (对 于 IPV6) .。 
e@ type: 套 接 字 类 型 可 以 根据 面向 连接 和 非 连接 分 为 SOCK STREAM ( 流 套 接 字 ) 或 
SOCK_DGRAM (数据 报 文 套 接 字 ) 。 

eprotocol: 一 般 不 填 ， 默 认为 0。 

family 参数 指定 调用 者 期 待 返回 的 套 接口 地 址 结构 的 类 型 。family 的 值 包括 3 种 : 
AF_INET、 AF INET6 和 AF_UNSPEC。 

如 果 指 定 AF_INET， 函 数 就 不 能 返回 任何 IPV6 相关 的 地 址 信息 。 

如 果 仅 指定 AF_INET6， 就 不 能 返回 任何 IPV4 地 址 信息 。 

AF_UNSPEC 意味 着 函数 返回 的 是 适用 于 指定 主机 名 和 服务 名 且 适 合 任何 协议 族 的 地 址 。 

如 果 某 个 主机 既 有 AAAA 记录 (IPV6) 地 址 ， 又 有 A 记录 (IPV4) 地 址 ， 那 么 AAAA 
记录 将 作为 sockaddr_in6 结构 返回 ， 而 A 记录 作为 sockaddr_in 结构 返回 。 

AF_INET6 用 于 IPV6 系统 ，AF_INET 和 PF_INET 用 于 IPV4 系统 。 

AF 表示 ADDRESS FAMILY 地 址 族 。 

PF 表示 PROTOCOL FAMILY 协议 族 。 

在 Windows 中 ，AF_INET 与 PF_INET 完全 一 样 ， 在 UNIX/Linux 系统 中 ， 不 同 版 本 的 
AF_INET 与 PF_INET 有 微小 差别 。 

人 ED 将 socket 绑 定 (指派 ) 到 指定 地 址 上 ，socketbind(address)。 


address 必须 是 一 个 双 元 素 元 组 ((host,port)), 参数 为 主机 名 或 ip 地 址 + 端口 号 。 如 果 端 口号 
正在 被 使 用 或 保留 、 主 机 名 或 IP 地 址 错误 ， 就 会 引发 socke.error 异常 。 

CT03 绑 定 后 必须 准备 好 套 接 字 ， 以 便 接 受 连接 请 求 。 

请 求 方式 如 下 : 

socket.listen(backlog) 

backlog 用 于 指定 最 多 连接 数 ， 至 少 为 1。 接 到 连接 请 求 后 ， 这 些 请 求 必须 排队 ， 如 果 队 
列 已 满 ， 就 拒绝 请 求 。 

人 4 服务 器 套 接 字 通 过 socket 的 accept 方法 等 待 客户 请 求 一 个 连接 。 

请 求 方式 如 下 : 


connection,address=socket.accept() 





.310 。 
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调用 accept 方法 时 ，socket 会 进入 等 待 ( 或 阻塞 ) 状态 。 客 户 请 求 连 接 时 ，accept 方法 建 
立 连接 并 返回 服务 器 。accept 方法 返回 一 个 含有 两 个 元 素 的 元 组 ， 如 (connection, address) 。 
第 一 个 元 素 (connection) 是 新 的 socket 对 象 , 服务 器 通过 它 与 客户 通信 ; 第 二 个 元 素 (address) 
是 客户 的 互联 网 地 址 。 

人 5 处 理 阶段 ， 服 务 器 和 客户 通过 send 和 recv 方法 通信 (传输 数据 ) 。 


服务 器 调用 send， 并 采用 字符 串 形式 向 客户 发 送信 息 。send 方法 返回 已 发 送 的 字符 个 数 。 
服务 器 使 用 recv 方法 从 客户 接收 信息 。 调 用 recv 时 ， 必 须 指定 一 个 整数 控制 本 次 调用 所 接收 
的 最 大 数据 量 。recv 方法 在 接收 数据 时 会 进入 blocket 状态 ， 最 后 返回 一 个 字符 串 ， 用 于 表示 
收 到 的 数据 。 如 果 发 送 的 量 超过 recv 允许 的 量 ， 数 据 就 会 被 截断 。 多 余 的 数据 将 缓冲 于 接收 
端 。 以 后 调用 recv 时 ， 多 余 的 数据 会 从 缓冲 区 删除 。 
06 传输 结束 ， 服 务 器 调用 socket 的 close 方法 以 关闭 连接 。 
建立 一 个 简单 的 客户 连接 需要 4 个 步骤 。 
(1) 创建 一 个 socket 以 连接 服务 器 socket=socket.socket(family,type)。 
(2) 使 用 socket 的 connect 方法 连接 服务 器 socket.connect((host,port))。 
(3) 客户 和 服务 器 通过 send 和 recv 方法 通信 。 
(4) 结束 后 ， 客 户 通 过 调用 socket 的 close 方法 关闭 连接 。 


15.3.3 ”socket 对 象 〈 内 建 ) 方法 
socket 提供 了 表 15-1 所 示 的 服务 器 端 套 接 字 函数 。 
表 15-1 ”服务 器 端 套 接 字 函 数 






































函数 描述 
bind() 绑 定 地 址 (hostport) 到 套 接 字 ,， 在 AF_INET 下 ， 以 元 组 〈hostport) 的 形式 表示 地 址 
listen() 开始 TCP 监听 。backlog 指定 在 拒绝 连接 之 前 ， 操 作 系统 可 以 挂 起 的 最 大 连接 数量 。 该 值 至 少 


为 1， 大 部 分 应 用 程序 设 为 5 就 可 以 了 
accept() 被 动 接受 TCP 客户 端 连接 ， 等 待 连接 的 到 来 


socket 提供 了 表 15-2 所 示 的 客户 端 套 接 字 函 数 。 
表 15-2 ”客户 端 套 接 字 函 数 


函数 描述 
connect() 主动 初始 化 TCP 服务 器 连接 。 一 般 address 的 格式 为 元 组 (hostname:port)。 如 果 连 接 出 错 ， 就 
返回 socketerror 错误 
connect_ ex0 | connect0 函 数 的 扩展 版 本 ， 出 错时 返回 出 错 码 而 不 是 抛 出 异常 


socket 提供 了 表 15-3 所 示 的 公共 用 途 套 接 字 函数 。 
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表 15-3 ”公共 用 途 套 接 字 函 数 




















函数 描述 

recv0 接收 TCP 数据 ， 数 据 以 字符 串 形式 返回 ，bufsize 指定 要 接收 的 最 大 数据 
量 。flag 提供 有 关 消息 的 其 他 信息 ， 通 常 可 以 忽略 

sendO 发 送 TCP 数据 ,将 string 中 的 数据 发 送 到 连接 的 套 接 字 。 返 回 值 是 要 发 送 
的 字 节 数量 ， 该 数量 可 能 小 于 string 的 字 节 大 小 

SendallO 完整 发 送 TCP 数据 。 将 string 中 的 数据 发 送 到 连接 的 套 接 字 ， 在 返回 之 前 
尝试 发 送 所 有 数据 。 成 功 返 回 None， 失 败 抛 出 异常 

recvform() 接收 UDP 数据 ， 与 recv0 类 似 ， 返 回 值 是 (data,address)。 其 中 ，data 是 
包含 接收 数据 的 字符 串 ，address 是 发 送 数据 的 套 接 字 地 址 

sendto() 发 送 UDP 数据 ， 将 数据 发 送 到 套 接 字 ，address 是 形式 为 〈ipaddrport) 的 
元 组 ， 指 定 远程 地 址 。 返 回 值 是 发 送 的 字 节 数 

close() 关闭 套 接 字 

getpeername() 返回 连接 套 接 字 的 远程 地 址 。 返 回 值 通常 是 元 组 〈ipaddrport) 

getsockname() 返回 套 接 字 的 地 址 。 通 常 是 一 个 元 组 (ipaddr,port) 

setsockopt(level,optname,value) 设置 给 定 套 接 字 选 项 的 值 

getsockopt(level,optname[.buflen]) | 返回 套 接 字 选 项 的 值 





settimeout(timeout) 


设置 套 接 字 操作 的 超时 期 ，timeout 是 一 个 浮 点 数 ， 单 位 是 秒 。 值 为 None 
表示 没有 超时 期 。 一 般 超时 期 应 该 在 刚 创建 套 接 字 时 设置 ， 因 为 可 能 用 于 
连接 操作 (如 connect()) 





gettimeout() 返回 当前 超时 期 的 值 ， 单 位 是 秒 ， 如 果 没 有 设置 超时 期 ， 就 返回 None 

fileno() 返回 套 接 字 的 文件 描述 符 

setblocking(flag) 如 果 flag 为 0， 就 将 套 接 字 设 为 非 阻塞 模式 ， 否 则 将 套 接 字 设 为 阻塞 模式 
(默认 值 )。 非 阻塞 模式 下 ， 如 果 调 用 recv0 没 有 发 现任 何 数据 ， 或 send0 
调用 无 法 立即 发 送 数据 ， 就 会 引起 socketerror 异常 

makefile0 创建 一 个 与 该 套 接 字 相关 联 的 文件 


15.4 TCP 编程 


Socket 是 网 络 编程 的 一 个 抽象 概念 。 通 常 我 们 用 一 个 Socket 表示 “打开 了 一 个 网 络 链接 ”， 
而 打开 一 个 Socket 需要 知道 目标 计算 机 的 IP 地 址 和 端口 号 , 并 且 指 定 协议 类 型 。 大 多 数 连接 都 是 
可 靠 的 TCP 连接 。 创 建 TCP 连接 时 ， 主 动 发 起 连接 的 是 客户 端 ， 被 动 响应 连接 的 是 服务 器 。 


15.4.1 客户 端 


当 我 们 在 浏览 器 中 访问 某 个 网 站 时 ， 自 己 的 计算 机 就 是 客户 端 ， 浏 览 器 会 主动 向 所 访问 


网 站 的 服务 器 发 起 连接 。 如 果 


- 切 顺利 ， 所 访问 网 站 的 服务 器 接受 了 我 们 的 连接 ， 一 个 TCP 


连接 就 建立 起 来 了 ， 接 着 就 可 以 发 送 网 页 内 容 了 。 
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例如 ， 要 创建 一 个 基于 TCP 连接 的 Socket (以 连接 本 地 为 例 ) ， 可 以 这 样 做 : 


# 导入 socket 库 
import socket 


# 创建 一 个 socket 

s= socket.socket(socket.AF_INET, socket.SOCK _ STREAMD 
# 获取 本 地 主机 名 

host = socket.gethostname() 

# 设置 端口 号 

port= 9999 

# 连接 服务 ， 指 定 主机 和 端口 

s.connect((host, port)) 


创建 Socket 时 ，AF_INET 指定 使 用 IPv4 协议 。 如 果 要 用 更 先进 的 IPv6， 就 指定 为 
AF_INET6。SOCK_STREAM 指定 使 用 面向 流 的 TCP 协议 ， 这 样 一 个 Socket 对 象 就 创建 成 功 
了 ， 但 是 还 没有 建立 连接 。 

如 果 客 户 端 要 主动 发 起 TCP 连接 ,就 必须 知道 服务 器 的 IP 地 址 和 端口 号 。 比 如 百度 的 了 
地 址 可 以 用 域名 www.baidu.com 自动 转换 到 IP 地 址 ， 但 是 怎么 知道 百度 服务 器 的 端口 号 呢 ? 

作为 服务 器 ， 提 供 服务 时 端口 号 必须 固定 下 来 。 由 于 我 们 想 要 访问 网 页 ， 因 此 新 浪 提供 
网 页 服务 的 服务 器 必须 把 端口 号 固定 在 80 端口 。80 端口 是 Web 服务 的 标准 端口 。 其 他 服务 
都 有 对 应 的 标准 端口 号 ， 如 SMTP 服务 是 25 端口 ，FTP 服务 是 21 端口 ， 等 等 。 端 口号 小 于 
1024 的 是 Internet 标准 服务 端口 ， 端 口号 大 于 1024 的 可 以 任意 使 用 。 

例如 ， 连 接 百度 服务 器 的 代码 如 下 : 

s.connect((‘www.baidu.com', 80)) 

建立 TCP 连接 后 ， 我 们 可 以 向 百度 服务 器 发 送 请 求 ， 要 求 返 回首 页 的 内 容 : 

# 发 送 数据 : 

s.send(b'GET / HTTP/1.1\rnHost: www.baidu.com\r nConnection: close\rn\m\n') 

TCP 连接 创建 的 是 双向 通道 ， 双 方 可 以 同时 给 对 方 发 数据 。 谁 先 发 、 谁 后 发 ， 怎 么 协调 ， 
要 根据 具体 协议 决定 。 例 如，HTTP 协议 规定 客户 端 必须 先 发 请 求 给 服务 器 ,服务器 收 到 后 才 
发 数据 给 客户 端 。 

发 送 的 文本 格式 必须 符合 HTTP 标准 。 如 果 格 式 没 问题 ， 接 下 来 就 可 以 接收 百度 服务 器 
返回 的 数据 了 : 

# 接收 数据 

buffer = 

while True: 

# 每 次 最 多 接收 1k 字 节 
d=s.recv(1024) 
if d: 
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buffer.append(d) 
else: 
break 
data = b".join(buffer) 


接收 数据 时 ， 调 用 recv(max) 方 法 一 次 最 多 接收 指定 的 字 节 数 ， 因 此 会 在 while 循环 中 反 
复 接收 ， 直 到 recv0 返 回 空 数据 ， 表 示 接 收 完毕 ， 退 出 循环 。 
接收 完 数据 后 ， 调 用 close() 方 法 关闭 Socket， 一 次 完整 的 网 络 通信 就 结束 了 : 
# 关闭 连接 
s.close() 
接收 到 的 数据 包括 HTTP 头 和 网 页 ， 我 们 只 需要 把 HTTP 头 和 网 页 分 离 一 下 ， 输 出 HTTP 
将 网 页 内 容 保存 到 文件 : 
header, html = data.split(b\r\n\rn', 1) 
print(header.decode('utf-8')) 
# 把 接收 的 数据 写 入 文件 
with open('baidu.html', ‘wb") as f: 
f.write(html) 
接 下 来 ， 只 需要 打开 baidu.html 文件 ， 就 可 以 进入 百度 首页 了 。 
下 面 是 以 上 功能 的 完整 代码 。 
#! /usr/bin/python3 
# -*- coding:UTF-8 -*- 


import socket 


def socket_client(): 
# 创建 socket 对 象 
s= Socketsocket(socket.AF INET, socket.SOCK STREAMD) 
# 获取 主机 名 
host = "www.baidu.com' 
# 设置 端口 号 
port= 80 
# 连接 服务 ， 指 定 主机 和 端口 
s.connect((host, port)) 
# 发 送 数据 
s.send(b'GET / HTTP/1.1\rnHost: www.baidu.com\r nConnection: close\\n\r\n') 
# 接收 数据 
buffer=[] 
while True: 
# 每 次 最 多 接收 Ik 字 节 
d= srecv(1024) 
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ifd: 
buffer.append(d) 
else: 
break 
data = b"join(buffer) 


header, html = data.split(b\rn\r\n', 1) 

Print(header.decode('utf-8")) 

# 把 接收 的 数据 写 入 文件 

with open('baidu.html', ‘wb') as f: 
f.write(html) 

s.close() 


def main(): 
socket_client() 


if_name_ 一 ' main ': 
main() 
15.4.2 ”服务 器 


和 客户 端 编程 相 比 ， 服 务 器 编程 更 复杂 一 些 。 

服务 器 编程 首先 要 绑 定 一 个 端口 ， 监 听 来 自 其 他 客户 端的 连接 。 如 果 某 个 客户 端 发 起 连 
接 了 ， 服 务 器 就 与 该 客户 端 建立 Socket 连接 ， 随 后 的 通信 就 靠 这 个 Socket 连接 了 。 

服务 器 会 打开 固定 端口 (如 80) 监听 ， 每 发 起 一 个 客户 端 连接 ， 就 创建 该 Socket 连接 。 
由 于 服务 器 有 大 量 来 自 客户 端的 连接 ， 因 此 要 能 够 区 分 一 个 Socket 连接 是 和 哪个 客户 端 绑 定 
的 。 确 定 唯一 的 Socket 依赖 4 项: 服务 器 地 址 、 服 务 器 端口 、 客 户 端 地 址 、 客 户 端 端口 。 

服务 器 还 需要 同时 响应 多 个 客户 端 请 求 ， 每 个 连接 都 需要 一 个 新 进程 或 新 线程 处 理 ， 否 
则 服务 器 一 次 只 能 服务 一 个 客户 端 。 

下 面 编写 一 个 简单 的 服务 器 程序 ， 用 于 接收 客户 端 连接 ， 把 客户 端 发 过 来 的 字符 串 加 上 
Hello 再 发 回去 。 

首先 创建 一 个 基于 IPv4 和 TCP 协议 的 Socket， 操 作 如 下 : 


s= socket.socket(socket.AF_INET, socketSOCK STREAMD) 


接 下 来 绑 定 监 听 的 地 址 和 端口 。 服 务 器 可 能 有 多 块 网 卡 ， 可 以 绑 定 到 某 一 块 网 卡 的 卫 地 
址 上 ， 也 可 以 用 0.0.0.0 绑 定 到 所 有 网 络 地 址 ， 还 可 以 用 127.0.0.1 绑 定 到 本 机 地 址 。127.0.0.1 
是 一 个 特殊 IP 地 址 ， 表 示 本 机 地 址 ， 如 果 绑 定 到 这 个 地 址 ， 客 户 端 必须 同时 在 本 机 运行 才能 
连接 ， 外 部 计算 机 无 法 连接 进来 。 

端口 号 需要 预先 指定 。 因 为 我 们 写 的 服务 不 是 标准 服务 ， 所 以 用 9999 这 个 端口 号 。 注 意 ， 
小 于 1024 的 端口 号 必须 有 管理 员 权限 才能 绑 定 ， 操 作 如 下 : 
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# 获取 本 地 主机 名 

host = socket.gethostname() 
# 设置 端口 号 

port= 9999 

# 监听 端口 

s.bind((host, port)) 


接着 调用 listen0 方 法 开始 监听 端口 ， 传 入 的 参数 指定 等 待 连接 的 最 大 数量 : 


# 设置 最 大 连接 数 ， 超 过 后 排队 
s.listen(5) 


接 下 来 ， 服 务 器 程序 通过 一 个 永久 循环 接受 来 自 客户 端的 连接 ，accept() 会 等 待 并 返回 一 
个 客户 端 连接 ， 操 作 如 下 : 
while True: 
# 接受 一 个 新 连接 
sock, addr = s.accept() 
# 创建 新 线程 处 理 TCP 连接 
t= threading.Thread(target=tcplink, args=(sock, addr)) 
t.start() 


每 个 连接 都 必须 创建 新 线程 〈 或 进程 ) 来 处 理 ， 和 否则 单线 程 在 处 理 连 接 的 过 程 中 无 法 接 
受 其 他 客户 端 连接 ， 操 作 如 下 
def tcp_link(sock, addr): 
Print('Accept new connection from %s:%s...' % addr) 
sock.send(' 欢 迎 学 习 Python 网 络 编程 .encode('utf-8')) 
while True: 
data = sock.recv(1024) 
time.sleep(1) 
if not data or data.decode('utf-8") 一 'exit: 
break 
sock.send(('Hello, %s!' % data.decode("utf-8")).encode('utf-8")) 
sock.close() 
Print('Connection from %s:%s closed.' % addr) 


连接 建立 后 ， 服 务 器 首先 发 一 条 欢迎 消息 ， 然 后 等 待 客户 端 数据 ， 并 加 上 Hello 再 发 送 给 
客户 端 。 如 果 客 户 端 发 送 了 exit 字符 串 ， 就 直接 关闭 连接 。 

要 使 用 这 个 服务 器 程序 ， 我 们 还 需要 一 个 客户 端 程序 ， 代 码 如 下 : 

s= socket.socket(socket.AF_INET, socket.SOCK_STREAM) 

# 获取 本 地 主机 名 

host = socket.gethostname() 

# 设置 端口 号 

port = 9999 
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# 建立 连接 

s.connect((host, port)) 

# 接收 欢迎 消息 

print(s.recv(1024).decode('utf-8")) 

for data in [小 萌 '' 小 智 ,' 小 强 ]: 
# 发 送 数据 
S.Send(data.encode(utf-8)) 
print(s.recv(1024).decode('utf-8")) 

S.Send(b'exit) 

s.close() 

注意 ， 客 户 端 程序 运行 完毕 就 退出 了 ， 而 服务 器 程序 会 永远 运行 下 去 ， 必 须 按 CtrltC 退 

出 程序 。 
下 面 是 以 上 功能 的 完整 代码 。 


服务 端 代码 实现 : 


#! /usr/bin/python3 
# -#- coding:UTF-8 -*- 


import socket 
import threading 
import time 


def socket_server(): 
# 创建 socket 对 象 
server_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM) 


# 获取 本 地 主机 名 


host = socket.gethostname() 
port = 9999 


# 绑 定 端口 
server_socket.bind((host, port)) 


# 设置 最 大 连接 数 ， 超 过 后 排队 


server_socket.listen(5) 


while True: 
# 接受 一 个 新 连接 
sock, addr = server_socket.accept() 
# 创建 新 线程 处 理 TCP 连接 
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t= threading.Thread(target=tcp_link, args=(sock, addr)) 
t.start() 


def tecp_link(sock, addr): 

print('Accept new connection from %s:%s...' % addr) 
sock.send(' 欢 迎 学 习 Python 网 络 编程 !.encode(utf-8)) 
while True: 

data = sock.recv(1024) 

time.sleep(1) 

if not data or data.decode('utf-8") 一 'exit: 

break 

sock.send(('Hello, %s! % data.decode('utf-8")).encode('utf-8")) 
sock.close() 
Print('Connection from %s:%s closed.' % addr) 


def main(): 


socket_server() 


if_name 一 main ': 
main() 
客户 端 代码 实现 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


import socket 


def socket_client(): 

s= Socketsocket(socket.AF INET, socket.SOCK_STREAM) 

# 获取 本 地 主机 名 

host = socket.gethostname() 

port= 9999 

# 建立 连接 

s.connect((host, port)) 

# 接收 欢迎 消息 

print(s.recv(1024).decode('utf-8")) 

for data in [小 萌 ',' 小 智 ,' 小 强人]: 
# 发 送 数 据 
s.send(data.encode('utf-8")) 
print(s.recv(1024).decode('utf-8")) 

S.Send(b'exit) 
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s.close() 


def main(): 

socket_client() 
if_name_ ==—' main ': 

main() 
服务 器 和 客户 端 执行 结果 如 图 15-1 和 15-2 所 示 。 
E:\python\pythoninstall\python. exe D:/python/workspace/socket_server test. py 


Accept new conmection from 192.168. 47.1:64215... 
Connection from 192.168. 47.1:64215 closed. 








15-1 服务 器 输出 信息 


E:\python\pythoninstall\python. exe D:/python/workspace/socket_client. test. py 
欢迎 学 习 Python 有 络 编程 ! 

Hel1o， 小 萌 ! 

Hello， 小 智 ! 

Hello， 小 强 ! 








图 15-2 客户 端 输出 信息 
15.5 UDP 编程 


TCP 用 于 建立 可 靠 连接 ， 并 且 通 信 双 方 可 以 以 流 的 形式 发 送 数据 。 相 对 于 TCP，UDP 面 
向 无 连接 的 协议 。 

使 用 UDP 协议 时 不 需要 建立 连接 , 只 需要 知道 对 方 的 卫 地 址 和 端口 号 就 可 以 直接 发 数据 
包 。 但 是 发 送 的 数据 包 是 否 能 到 达 就 不 知道 了 。 

虽然 用 UDP 传输 数据 不 可 靠 ， 但 是 优点 是 速度 快 。 对 于 不 要 求 可 靠 到 达 的 数据 可 以 使 用 
UDP 协议 。 

下 面 来 看 如 何 通过 UDP 协议 传输 数据 。 和 TCP 类 似 ， 使 用 UDP 的 通信 双方 也 分 为 客户 
端 和 服务 器 。 服 务 器 首先 需要 绑 定 端口 ， 操 作 如 下 : 

s= Socket.socket(socketAF_INET, socket.SOCK_ DGRAM) 

host = socket.gethostname() 

port= 9999 

# 绑 定 端口 

s.bind((host, port)) 
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创建 Socket 时 ，SOCK_DGRAM 指定 了 Socket 的 类 型 是 UDP。 绑 定 端口 和 TCP 一 样 ， 
不 过 不 需要 调用 listen() 方 法 ， 而 是 直接 接收 来 自任 何 客户 端的 数据 ， 操 作 如 下 : 
while True: 
# 接收 数据 
data, addr = s.recvfrom(1024) 
print(Received from %s:%s.' % addr) 
s.sendto(b'Hello, %s!' % data, addr) 


recvfrom() 方 法 返回 数据 和 客户 端的 地 址 与 端口 。 这 样 ， 服 务 器 收 到 数据 后 ， 直 接 调用 
sendto() 就 可 以 把 数据 用 UDP 发 给 客户 端 。 
客户 端 使 用 UDP 时 ， 首 先 仍然 是 创建 基于 UDP 的 Socket， 然 后 不 需要 调用 connect()， 
直接 通过 sendto0) 给 服务 器 发 数据 ， 操 作 如 下 : 
$= socket.socket(socket.AF_INET, socket.SOCK DGRAM) 
for data in [b'Michael', b'Tracy', b'Sarah ']: 
# 发 送 数 据 
s.sendto(data, (127.0.0.1, 9999)) 
# 接收 数据 
print(s.recv(1024).decode('utf-8")) 
s.close() 


下 面 是 以 上 功能 的 完整 代码 。 
服务 器 端 : 


#! /usr/bin/python3 
# -*- coding:UTF-8 -*- 


import socket 


def socket_udp_server(): 
s= socket.socket(socket.AF_INET, socket.SOCK_ DGRAM) 
host = socket.gethostname() 
port = 9999 
# 绑 定 端口 
s.bind((host, port)) 


while True: 
# 接收 数据 
data, addr = s.recvfrom(1024) 
Print(Received from %s:%s.' % addr) 
s.sendto(b'hello, %s,welcome! % data, addr) 
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def main(): 
socket udp server() 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


import socket 


def socket udp_clientO: 
$= socket.socket(socket.AF_INET, socket.SOCK_ DGRAM) 
for data in [小 萌 ', ' 小 智 ]: 
host = socket.gethostname() 
port= 9999 
# 发 送 数据 
s.sendto(data.encode('utf-8"), (host, port)) 
# 接收 数据 
print(s.recv(1024).decode('utf-8")) 
s.close() 


def main(): 
socket_udp_client() 


让 _name 一 '_main 
main() 
服务 器 和 客户 端 执 行 结果 如 图 15-3 和 15-4 所 示 。 


E:\python\pythoninstall\python exe D:/pythom/workspace/udp_test. py 
Received from 192.168. 47.1:65102. 
Received from 192. 163. 47.1:65102. 








图 15-3 服务 器 输出 信息 





E:\python\pythoninstall\python exe D:/python/workspace/socket_client_test. py 
hello， 小 戎 , welcome! 
hello， 小 智 , welcone! 





154 客户 端 输出 信息 
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15.6 “urllib 模块 


在 Python 中 ， 能 使 用 的 各 种 网 络 工作 库 中 ， 功 能 最 强大 的 是 urllib。urllib 能 够 通过 网 络 
访问 文件 , 就 像 这 些 文件 在 我 们 电脑 上 一 样 。 通过 一 个 简单 的 函数 调用 , 几乎 可 以 把 任何 URL 
指向 的 事物 用 做 程序 输入 。 

urllib 提供 了 一 系列 用 于 操作 URL 的 功能 ， 其 中 最 常用 的 请 求 是 GET 和 POST。 下 面 简 
单 介绍 一 下 在 Python 中 使 用 GET 和 POST 请 求 。 


15.6.1 ”GET 请 求 


urllib 的 request 模块 可 以 非常 方便 地 抓 取 URL 内 容 , 也 就 是 发 送 一 个 GET 请 求 到 指定 页 
面 ， 然 后 返回 HTTP 响应 ， 示 例如 下 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 





from urllib import request 


def get_request(): 
with request.urlopen('http://www.baidu.com') as f: 
data =f.read() 
Print('Status:', f.status, freason) 
fork v in f.getheaders(): 
Pprint('%s: %s' % (k, v)) 
print('Data:', data.decode(utf-8)) 


def main(): 
get_request() 


if_name ==" main_": 


main() 
运行 程序 ， 得 到 HTTP 响应 的 头 和 JSON 数据 ， 代 码 如 下 : 


Status: 200 OK 

Content-Type: text/html 

Content-Length: 6234 

Data: <!IDOCTYPE html><html><head><meta 
http-equiv="content-type"content="text/html;charset=utf-8"/><meta 
http-equiv="X-UA-Compatible"content="IE=Edge"/><meta content="never"name="referrer"/><title> 百 度 一 下 , 你 
就 知道 
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如 果 想 模拟 浏览 器 发 送 GET 请 求 ， 就 需要 使 用 Request 对 象 ， 通 过 往 Request 对 象 添加 
HTTP 头 可 以 把 请 求 伪装 成 浏览 器 。 


15.6.2 ”POST 请 求 


如 果 要 以 POST 发 送 一 个 请 求 ， 就 要 把 参数 data 以 bytes 形式 传 入 。 
模拟 一 个 微 博 登 录 ， 先 读 取 登 录 的 邮箱 和 口令 ， 然 后 按照 weibo.cn 登录 页 的 格式 以 
username=xxx&password=xxx 的 编码 传 入 ， 代 码 实现 如 下 : 


#! /usr/bin/python3 
# -#- coding:UTF-8 -*- 


from urllib import request, parse 


def login_post(): 
print(Login to weibo.cn...') 
email = input(‘Email: ) 
passwd = input('Password: ) 
login_data = parse.urlencode([ 

(usemame' email), 

(‘password', passwd), 

(entry, 'mweibo'), 

(client_id', "), 

('savestate’, "1"), 

(ec, "), 

(‘pagerefer, 
‘https://passport.weibo.cn/signin/welcome?' 
‘entry=mweiboéer=http%3A%2F%2Fm.weibo.cn%2F"') 

) 


req = request.Request('https://passport.weibo.cn/sso/login') 
Treq.add_header('Origin', 'https://passport.weibo.cn') 
req.add_header('User-Agent', 
"Mozilla/6.0 AppleWebKitV536.26 
‘(KHTML., like Gecko) Version/8.0' 
"Safari/8536.25') 
req.add_header('Referer', 
"https://passport.weibo.cn/signin/login? 
'entry=mweibo&res=wel&wm=3349' 
'&r=http%3A%2F%2Fm.weibo.cn%2F") 


with request.urlopen(req, data=login_data.encode('utf-8")) as £ 
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Print('Status:', f.status, freason) 
fork v in f.getheaders(): 

Pprint('%s: %s' % (k, v)) 
Pprint(Data:', fread|.decode('utf-8")) 


def main(): 
login_post() 


if_name ==" main_": 
main() 
执行 该 程序 ， 并 输入 对 应 的 email 和 password， 若 账户 存在 ， 则 得 到 如 下 结果 : 
Status: 200 OK 
Server: nginx/1.2.0 
Date: Sat, 22 Oct 2016 08:38:37 GMT 


Data: {"retcode":20000000,"msg":"™","data":{...,"uid":"3538172252"}} 
若 登 录 失 败 ， 则 得 到 如 下 输出 结果 : 


Status: 200 OK 
Server: nginx/1.2.0 
Date: Sat, 22 Oct 2016 08:46:04 GMT 


{"retcode":50011015,"msg":"\u7528\u6237\u540d\u6216\uSbc6\u7801\u9519\u8bef","data": {"username":"test(@ali 
yun.com","errline":634}} 


urllib 提供 的 功能 是 利用 程序 执行 各 种 HTTP 请 求 。 如 果 要 模拟 浏览 器 完成 特定 功能 ， 就 
要 把 请 求 伪 装 成 浏览 器 。 伪装 的 方法 是 先 监控 浏览 器 发 出 的 请 求 , 再 根据 浏览 器 的 请 求 头 进行 
伪装 ，User-Agent 头 就 是 用 来 标识 浏览 器 的 。 


15.7 调 试 
当 我 们 使 用 更 高 级 的 程序 时 ， 普 通 输出 和 手动 检查 程序 的 方式 已 经 不 那么 好 用 了 。 下 面 


是 一 些 高 级 程序 调试 的 建议 : 


(1) 检查 概要 信息 和 类 型 。 运 行 时 错误 的 一 个 常见 原因 是 某 个 值 的 类 型 不 对 。 调 试 这 种 
错误 时 ， 通 常 只 需要 输出 值 的 类 型 就 足够 了 。 
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(2) 编写 自 检查 逻辑 。 有 时 可 以 写 代码 自动 检查 错误 。 比 如 登录 时 ， 如 果 第 一 次 登录 失 
败 , 就 可 以 隔 一 定时 间 间 隔 再 次 登录 , 超出 一 定 登录 次 数 就 不 再 尝试 。 或 者 在 访问 某 个 网 站 时 ， 
根据 返回 响应 结果 中 的 某 个 或 某 些 值 选择 做 对 应 的 工作 。 

(3) 美化 输出 。 格 式 化 输出 可 以 更 容易 发 现 错误 ， 如 将 内 置 类 型 的 值 以 更 加 人 性 化 的 可 
读 格式 输出 。 另 一 方面 ， 花 费时 间 构 建 脚手架 代码 可 以 减少 未 来 调试 的 时 间 。 





15.8 问题 解答 


Python 网 络 编程 需要 学 习 哪些 网 络 相关 知识 ? 
答 : Python 网 络 编程 是 一 个 很 大 的 范畴 ， 可 以 从 以 下 几 点 进行 相关 学 习 : 


(1) 学 习 如 何 使 用 Python 创建 socket， 如 何 将 socket 与 指定 的 IP 地 址 和 端口 进行 绑 定 ， 
使 用 socket 发 送 数 据 、 接 收 数据 。 

(2) 学 习 如 何 使 用 Python 处 理 线程 ， 从 而 编写 可 以 同时 处 理 多 个 请 求 的 Web 服务 器 。 

(3) 学 习 如 何 使 用 Python 控制 HTTP 层 的 逻辑 ， 如 何 创 建 HTTP GET、POST、PUT、 
DELETE 请 求 ， 如何 处 理 接收 到 的 HTTP 请 求 ， 这 些 分 别 涉及 Python 的 httplib、basehttpserver 
等 模块 。 

在 以 上 几 点 都 了 解 出 不 多 是 ， 接 下 来 掌握 一 种 Python 基本 的 Web 开发 框架 ， 如 web.py、 
Django、Pylon 等 。 在 学 习 框 架 的 基础 上 再 去 了 解 非 阻塞 式 的 HTTP Server (如 Tornado) 和 
Twisted (Python 编写 消息 驱动 的 网 络 引擎 ) 。 


15.9 温 故 知 新 ， 学 以 致 用 


本 章 介 绍 了 Python 用 于 网 络 编程 的 一 些 方法 。 究 竟 选 择 什么 方法 取决 于 程序 特定 的 需要 
和 开发 者 的 偏好 。 在 本 章 结束 前 回顾 一 下 学 到 的 概念 。 

(1) 什么 是 TCP/IP? 

(2) 有 哪些 网 络 设计 模块 ? 

(3) TCP 编程 和 UDP 编程 分 别 是 怎样 实现 的 ? 

尝试 思考 并 解决 如 下 问题 : 

(1) 写 程序 登录 某 个 网 站 。 

(2) 将 登录 返回 结果 写 入 一 个 html 文件 ， 使 得 可 以 直接 单 击 该 文件 进入 网 站 。 

(3) 对 返回 结果 进行 分 析 ， 提 取 一 些 有 用 信息 ， 如 提取 汉字 或 网 页 上 的 链接 地 址 。 





《2 漳 操作 数据 库 


使 用 简单 的 纯 文 本 方式 只 能 实现 有 限 的 功能 , 不 能 进行 
快速 查询 , 只 有 把 数据 全 部 读 到 内 存 中 才能 自己 遍历 。 不 过 
在 实际 应 用 中 , 我们 操作 的 数据 大 小 经 常 远 远 超过 内 存 , 根 
本 无 法 全 部 读 入 内 存 。 

为 了 便于 程序 保存 和 读 取 数 据 , 并 直接 通过 条 件 快速 查 
询 指 定 的 数据 ， 于 是 出 现 了 数据 库 (Database〉 这 种 专门 用 
于 集中 存储 和 查询 的 软件 。 

本 章 介 绍 在 Python 3.5 中 使 用 PyMySQL 连接 数据 库 ， 
并 实现 简单 的 增 、 删 、 改 、 查 。 





“Ar 
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16.1 数据库 介绍 


数据 库 历史 非常 久远 ， 早 在 1950 年 就 诞生 了 。 经 历 了 网 状 数据 库 、 层 次 数据 库 ， 我 们 现 
在 广泛 使 用 的 关系 数据 库 是 20 世纪 70 年 代 在 关系 模型 的 基础 上 诞生 的 。 
目前 ， 广 泛 使 用 的 关系 数据 库 分 为 付费 型 和 免费 型 。 付 费 型 数据 库 主 要 有 以 下 几 种 : 


(1) Oracle， 典 型 的 “高 富 帅 ”， 收 费 昂贵 ， 产 品 确实 好 ， 当 前 很 多 大 型 公司 仍然 使 用 它 。 

(2) SQL Server， 微 软 自家 产品 ，Windows 定制 专款 。 

(3) DB2，IBM 的 产品 。 

(4) Sybase， 曾 经 跟 微 软 关系 非常 亲密 ， 后 来 关系 破裂 ， 使 用 的 人 比较 少 了 ， 已 逐渐 淡 
出 大 家 的 视野 。 

这 些 数据 库 都 是 不 开源 而 且 付费 的 , 最 大 的 好 处 是 出 了 问题 可 以 找 厂家 解决 。 不 过 在 Web 
的 世界 里 ， 通 常 需要 部 署 成 千 上 万 数据 库 服务 器 ， 如 果 使 用 付费 型 数据 库 ， 赚 的 钱 都 会 被 拿 去 
买 服务 器 了 。 所 以 ， 无 论 是 Google、Facebook， 还 是 国内 的 BAT， 无 一 例外 都 选择 免费 的 
源 数据 库 。 当 前 流行 的 免费 数据 库 有 以 下 几 种 : 

(1) MySQL， 当 前 使 用 最 为 广泛 的 开源 数据 库 。 

(2) PostgreSQL， 学 术 气 息 有 点 重 ， 其 实 挺 不 错 ， 不 过 知名 度 没 有 MySQL 高 。 

(3) SQLite， 嵌 入 式 数 据 库 ， 适 合 桌面 和 移动 应 用 。 


作为 Python 开发 工程 师 ， 选 择 哪 款 免 费 数据 库 呢 ? 当然 是 MySQL。 因 为 MySQL 普及 率 
最 高 ， 出 了 错 可 以 很 容易 找到 解决 方法 ， 而 且 围 绕 MySQL 有 一 大 堆 监控 和 和 运 维 工具 ， 安 装 和 
使 用 很 方便 。 

为 了 继续 后 面 的 学 习 ， 你 需要 从 MySQL 官方 网 站 http:/www.mysql.com) 下 载 并 安装 
MySQL Community Server。 

你 也 许 还 听 说 过 NoSQL 数据 库 ， 很 多 NoSQL 宣传 速度 和 规模 远 远 超过 关系 数据 库 ， 是 
否 有 很 多 同学 觉得 有 了 NoSQL 就 不 需要 SQL 了 呢 ? 这 样 的 想法 是 错误 的 ， 在 摘 明 白 NoSQL 
之 前 ， 还 需要 先 明 白 SQL， 在 SQL 的 基础 上 学 习 NoSQL 很 容易 ， 反 过 来 就 不 行 了 。 

本 章 主要 介绍 Python 如 何 操作 数据 库 ， 并 不 是 单纯 介绍 数据 库 ， 如 果 你 想 从 零 学 习 关 系 
数据 库 和 基本 的 SQL 语句 ， 还 需 查 看 相关 资料 。 














16.2 Python 数据 库 API 


Python 数据 库 API 是 为 方便 统一 操作 数据 库 而 提出 的 一 个 标准 接口 “API) ， 也 称 为 
DB-API。 


"327。 
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在 没有 Python DB-API 之 前 ,各 数据 库 之 间 的 应 用 接口 非常 混乱 ， 实 现 各 不 相同 。 如 果 项 
目 需要 更 换 数据 库 ， 就 需要 进行 大 量 修改 ， 非 常 不 便 。Python DB-API 的 出 现 就 是 为 了 解决 这 
些 问 题 。 

Python 所 有 数据 库 接口 程序 都 在 一 定 程度 上 遵守 Python DB-API 规范 。DB-API 定义 了 一 
系列 必需 的 对 象 和 数据 库存 取 方 式 , 以 便 为 各 种 各 样 的 底层 数据 库 系 统 和 数据 库 接口 程序 提供 

- 致 的 访问 接口 。 由 于 DB-API 为 不 同 数据 库 提供 了 一 致 的 访问 接口 ， 因 此 在 不 同 的 数据 库 之 

间 移植 代码 成 为 一 件 轻 松 的 事情 。 

DB-API 规范 包括 全 局 变量 、 异 常 、 连 接 、 游 标 和 类 型 等 基本 概念 ， 下 面 我 们 逐一 进行 
介绍 。 


16.2.1 全 局 变量 


DB-API 规范 规定 数据 库 接口 模块 必须 实现 一 些 全 局 属性 以 保证 兼容 性 。Python 提供 了 3 
个 描述 数据 库 模 块 特性 的 全 局 变量 ， 如 表 16-1 所 示 。 


表 16-1 ”Python DB-API 模 块 特性 全 局 变量 





变量 名 用 途 
apilevel 所 使 用 的 Python DB-API 版 本 
threadsafety 模块 的 线程 安全 等 级 
paramstyle 在 SQL 查询 中 使 用 的 参数 风格 


apilevel 指 的 是 API 级 别 ， 是 一 个 字符 串 常量 ， 表 示 这 个 DB-API 模块 所 兼容 的 DB-API 
最 高 版 本 号 。 例 如 ， 版 本 号 是 1.0、2.0， 如 果 未 定义 ， 就 默认 是 1.0。 

线程 安全 等 级 Threadsafety 是 一 个 整数 , 取 值 范围 如 下 : 

0 表示 不 支持 线程 安全 ， 多 个 线程 不 能 共享 此 模块 。 

1 表示 初级 线程 安全 支持 ， 线 程 可 以 共享 模块 ， 但 不 能 共享 连接 。 

2 表示 中 级 线程 安全 支持 ， 线 程 可 以 共享 模块 和 连接 ， 但 不 能 共享 游标 。 

3 表示 完全 线程 安全 支持 ， 线 程 可 以 共享 模块 、 连 接 及 游标 。 

参数 风格 (paramstyle) 表 示 执 行 多 次 类 似 查 询 时 ,参数 如 何 被 拼接 到 SQL 查询 中 。 值 format 
表示 标准 字符 串 格式 化 《使 用 基本 的 格式 代码 ) ， 可 以 在 参数 中 进行 拼接 的 地 方 插入 %s。 值 
pyformt 表示 扩展 的 格式 代码 ， 用 于 字典 拼接 ， 如 % (foo) 。 除 了 Python 风格 之 外 ， 还 有 3 
种 接合 方式 : qmark 的 意思 是 使 用 问号 ，numeric 表示 使 用 :1 或 :2 格式 的 字段 (数字 表示 参数 
的 序号 ) ， 而 named 表示 :foobar 这 样 的 字段 。 其 中 ，foobar 为 参数 名 。 


1622 寺 吊 


为 了 能 尽 可 能 准确 地 处 理 错误 ，DB-API 中 定义 了 一 些 异常 。 这 些 异常 被 定义 在 层次 结构 
中 ， 可 以 通过 一 个 except 块 捕 捉 多 种 异常 。 
异常 的 层次 如 表 16-2 所 示 。 


e209 
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表 16-2 ”DB-API 常 见 异常 



































异常 超 类 描述 
StandardError 所 有 异常 的 泛 型 基 类 
Waming StandardError 在 非 致 命 错误 发 生 时 引发 
Error StandardError 错误 异常 基 类 
InterfaceError Emror 数据 库 接口 错误 
DatabaseError Eror 与 数据 库 相 关 的 错误 基 类 
DataError DatabaseError 处 理 数据 时 出 错 
OperationalError DatabaseError 数据 库 执行 命令 时 出 错 
IntegrityError DatabaseError 数据 完整 性 错误 
IntemalError DatabaseError 数据 库 内 部 出 错 
ProgrammingError DatabaseError SQL 执行 失败 
NotSupportedError DatabaseError 试图 执行 数据 库 不 支持 的 特性 








16.2.3 ”连接 和 游标 


为 了 使 用 基础 数据 库 系 统 , 首先 必须 连接 它 。 连 接 数 据 库 需 要 使 用 具有 恰当 名 称 的 connect 
函数 。 该 函数 有 多 个 参数 ， 具 体 使 用 哪个 参数 需要 根据 数据 库 类 型 进行 选择 。DB-API 定义 了 
表 16-3 所 示 的 参数 作为 准则 建议 将 这 些 参数 按 表 中 给 定 的 顺序 传递 ) 。 参 数 类 型 为 字符 串 
类 型 。 





表 16-3 ”connect 函 数 常用 参数 








参数 名 是 否 可 选 
dsn 数据 源 名 称 ， 给 出 该 参数 表示 数据 库 依赖 
User 用 户 名 
password 用 户 密码 
host 主机 名 是 
database 数据 库 名 称 是 





connect 函数 返回 连接 对 象 ， 这 个 连接 对 象 表示 目前 和 数据 库 的 会 话 。 连 接 对 象 支持 的 方 

法 如 表 16-4 所 示 。 
表 16-4 连接 对 象 方法 

方法 名 描述 
close0) | 关闭 连接 后 ， 连 接 对 象 和 它 的 游标 均 不 可 用 
commit0 | 如 果 支 持 就 提交 挂 起 的 事务 ， 否 则 不 做 任何 事 
rollback0 | 回 滚 挂 起 的 事务 “可 能 不 可 用 ) 
cursor() 返回 连接 的 游标 对 象 


rollback 方法 可 能 不 可 用 ， 因 为 不 是 所 有 数据 库 都 支持 事务 。 
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commit 方法 总 是 可 用 的 ， 不 过 如 果 数 据 库 不 支持 事务 ， 它 就 没有 任何 作用 。 


cursor 方法 指 游标 对 象 。 


通过 游标 执行 SQL 查询 并 检查 结果 。 游 标 比 连接 支持 更 多 方法 ， 


而 且 在 程序 中 更 好 用 。 表 16-5 是 游标 方法 的 概述 ， 表 16-6 是 游标 特性 的 概述 。 


表 16-5 ”游标 对 象 方法 



































名 称 描述 
callproc(func[,args]) 使 用 给 定 的 名 称 和 参数 〈 可 选 ) 调用 已 命名 的 数据 库 程序 
close0) 关闭 游标 后 ， 游 标 不 可 用 
execute(op[,args]) 执行 SQL 操作 ， 可 能 使 用 参数 
executemany(op,args) 对 序列 中 的 每 个 参数 执行 SQL 操作 
fetchone() 把 查询 结果 集中 的 下 一 行 保存 为 序列 或 None 
fetchmany( [size]) 获取 查询 结果 集中 的 多 行 ， 默 认 尺 寸 为 arraysize 
fetchall) 将 所 有 剩余) 行 作为 序列 的 序列 
nextset() 调 至 下 一 个 可 用 的 结果 集 〈 可 选 ) 
setinputsizes(sizes) 为 参数 预先 定义 内 存 区 域 
setoutputsize(size[,col]) 为 获取 大 数据 值 设 定 缓冲 区 尺寸 

表 16-6 ”游标 对 象 特性 

名 称 描述 
arraysize fetchmany 中 返回 的 行 数 ， 具 i 
description 结果 列 描述 的 序列 ， 只 i 
rowcount 结果 中 的 行 数 ， 只 读 








游标 对 象 最 重要 的 属性 是 execute*0 和 fetch*0 方 法 。 所 有 对 数据 库 服务 器 的 请 求 都 由 这 两 
个 方法 完成 。 对 fetchmany() 方 法 来 说 ， 设 置 一 个 合理 的 arraysize 属性 很 有 有用。 当然， 在 不 需 





要 时 最 好 关 掉 游标 对 象 。 
16.2.4 ”类 型 


每 一 个 插入 数据 库 中 的 数据 都 对 应 一 个 数据 类 型 ， 每 一 列 数据 对 应 同一 个 数据 类 型 ， 不 














同 列 对 应 不 同 的 数据 类 型 。 在 数据 库 操作 的 过 程 中 ， 为 了 能 够 正确 与 基础 SQL 数据 库 进行 数 
据 交 互 操作 , DB-API 定 义 了 用 于 特殊 类 型 和 值 的 构造 函数 及 常量 ,所 有 模块 都 要 求实 现 表 16-7 
所 示 的 构造 函数 和 特殊 值 。 
表 16-7 ”DB-API 构 造 函 数 和 特殊 值 
构造 函数 和 特殊 值 的 名 称 描述 

Date(yr,mo,dy) 日 期 值 对 象 

Time(hr,min,sec) 时 间 值 对 象 

Timestamp(yr,mo,dy, hr, min,sec) 时 间 惟 对 象 

DateFromTicks(ticks) 创建 自 新 纪元 以 来 秒 数 的 对 象 
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( 续 表 ) 
构造 函数 和 特殊 值 的 名 称 描述 
TimeFromTicks(ticks) 创建 自 新 纪元 以 来 秒 数 的 时 间 值 对 象 
TimestampFromTicks(ticks) 创建 自 新 纪元 以 来 秒 数 的 时 间 截 值 对 象 
Binary(string) 对 应 二 进 制 长 字符 串 值 对 象 
STRING 描述 字符 串 列 对 象 ， 如 VARCHAR 
BINARY 描述 二 进 制 长 列 对 象 ， 如 RAW、BLOB 
NUMBER 描述 数字 列 对 象 
DATETIME 描述 日 期 时 间 列 对 象 
ROWID 描述 row ID 列 对 象 





注 : 新 纪元 指 1970-01-01 00:00:01 utc 时 间 


16.3 ”数据库 操作 


前 面 我 们 介绍 了 数据 库 的 基本 概念 ， 本 节 具 体 介 绍 数 据 库 的 连接 及 增 、 删 、 改 、 查 、 操 作 。 

下 面 的 示例 以 数据 库 为 TEST， 表 名 为 employee，employee 表 字 段 为 FIRST NAME、 
LAST NAME、 AGE、 SEX、 INCOME 和 CREATE_TIME。 

连接 数据 库 TEST 使 用 的 用 户 名 为 root， 密 码 为 root。 

在 系统 上 已 经 安装 了 Python PyMySQL 模块 。 若 不 知道 怎么 安装 ， 则 可 查阅 相关 资料 。 

如 果 对 SQL 语句 不 熟悉 ， 就 要 先 了 解数 据 库 的 一 些 基本 操作 ， 以 方便 更 好 理解 接 下 来 的 
内 容 。 


16.3.1 ”数据 库 连接 
下 面 是 连接 MySQL TEST 数据 库 的 实例 。 


#! /usr/bin/python 
# -*-coding:UTF-8-*- 





import pymysql 


def db_connect(): 
# 打开 数据 库 连接 


db= pymysql.connect("localhost", "root", "root", "test") 


# 使 用 cursor() 方 法 创建 一 个 游标 对 象 cursor 


cursor = db.cursor() 


# 使 用 execute() 方 法 执行 SQL 查询 
cursor.execute("SELECT VERSIONO") 


# 使 用 fetchone0 方法 获取 单条 数据 


data = cursor.fetchone() 
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print ("Database version : %s " % data) 


# 关闭 数据 库 连 接 
db.close() 


def main(): 
db _connect() 


if_name ==" main ": 


main() 
执行 结果 如 下 : 


Database version : 5.5.28 


16.3.2 ”创建 数据 库 表 


如 果 数 据 库 连 接 存在 ,我 们 就 可 以 使 用 execute() 方 法 为 数据 库 创 建 表 。 创 建 表 EMPLOYEE 
的 代码 如 下 : 

#! /usr/bin/python 

# -*-coding:UTF-8-*- 


import pymysql 
def create_table(): 
db= pymysql.connect("localhost", "root", "root", "test") 


# 使 用 cursor() 方法 创建 一 个 游标 对 象 cursor 


cursor = db.cursor() 


# 使 用 execute() 方法 执行 SQL， 如 果 表 存 在 就 删除 
cursor.execute("DROP TABLE IF EXISTS EMPLOYEE") 


# 使 用 预 处 理 语句 创建 表 
sql= """CREATE TABLE EMPLOYEE ( 
FIRST NAME CHAR(C20)NOTNULL, 
LAST NAME CHAR(20), 
AGE INT 
SEX CHAR(1), 
INCOME FLOAT 
CREATE_TIME DATETIME)""" 
try: 
cursor.execute(sqD) 
Print("CREATE TABLE SUCCESS.") 
except Exception as e: 
print("CREATE TABLE FAILED,CASE:%s" % e) 
finally: 
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# 关闭 数据 库 连 接 
db.close() 


def main(): 
create_table() 
if_name ==" main_": 


main() 
执行 结果 如 下 : 
CREATE TABLE SUCCESS. 


从 MySQL 客户 端 查 看 表 结 构 ， 如 图 16-1 所 示 。 


FIRST_NAME [A 
LAST_NAME char28> 
AGE int C11> 
SEX charC1> 
INCOME float 
CREATE_TIME datetime 


6 rows in set 《0.07 sec)》 





图 16-1 employee 表 结 构 


16.3.3 ”数据 库 插入 
下 面 使 用 SQL INSERT 语句 向 表 EMPLOYEE 插入 记录 (注意 使 用 了 datetime 模块 ) 。 


#! /usr/bin/python 
# -*-coding:UTF-8-*- 


import pymysql 


import datetime 


def insert_record(): 


db= pymysql.connect("localhost", "root", "root", "test") 


# 使 用 cursor() 方 法 获取 操作 游标 


cursor = db.cursor() 


# SQL 插入 语句 
sql= "INSERT INTO EMPLOYEE(FIRST NAME.LAST NAME,AGE, SEX, INCOME,"\ 
"CREATE TIME) VALUES('%s', '%s', %d, '%c', %d, '%s')" \ 
% (xiao, 'zhi', 22, 'M', 30000, datetime.datetime.now()) 
try: 
# 执行 sql 语句 


cursor.execute(sql) 
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# 提交 到 数据 库 执行 
db.commit() 
print("INSERT SUCCESS.") 
except Exception as e: 
print(INSERT INTO MySQL table failed.Case:%s' % e) 
# 如 果 发 生 错误 就 回 滚 
db.rollback() 
finally: 
# 关闭 数据 库 连 接 
db.close() 





def main(): 
insert_record() 


if_name ==" main_": 


main() 
执行 结果 如 下 : 
INSERT SUCCESS. 


从 MySQL 客户 端 查看 表 插 入 结果 ， 如 图 16-2 所 示 。 





39668 } 2916-19-685 22:29:37 上 


ysql> 


图 16-2 插入 数据 结果 


16.3.4 数据库 查 询 
Python 查询 MySQL 使 用 fetchone() 方 法 获取 单条 数据 ， 使 用 fetchall0 方 法 获取 多 条 数据 。 
e@ ”fetchone(): 该 方法 获取 下 一 个 查询 结果 集 。 结 果 集 是 一 个 对 象 。 
@ ”fetchall(): 接收 全 部 返回 结果 行 。 
@ Rowcount: 这 是 一 个 只 读 属性 ， 返 回执 行 execute() 方 法 后 影响 的 行 数 。 
下 面 的 示例 用 于 查询 EMPLOYEE 表 中 salary 工资) 字段 大 于 10000 的 所 有 数据 。 
#! /usr/bin/python 
# -*-coding:UTF-8-*- 
import pymysql 


def query_data(): 
# 打开 数据 库 连 接 
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db= pymysql.connect("localhost", "root", "root", "test") 


# 使 用 cursor() 方 法 获取 操作 游标 


cursor = db.cursor() 


# SQL 查询 语句 
sql= "SELECT* FROM EMPLOYEE WHERE INCOME > %d" % 10000 
try: 
# 执行 SQL 语句 
cursor.execute(sql) 
# 获取 所 有 记录 列表 
Tresults = cursor.fetchall() 
for row in results: 
fname = row[0] 
Iname = row[1] 
age = row[2] 
sex = row[3] 
income = row[4] 
create_time = row[5] 
# 输出 结果 
print("first_name=%s,last_name=%s,age=%d,\n" 
"sex=%s,income=%d,create_time=%s" % 
(first_name, last_name, age, sex, income, create_time)) 
except Exception as e: 
print("Error: unable to fecth data.Error info:%s" % e) 
finally: 
# 关闭 数据 库 连 接 
db.close() 


def main(): 
query_data() 


if_name ==" main_": 


main() 
执行 结果 如 下 : 


first_name=xiao,last_name=zhi,age=22, 
sex=M,income=30000,create_time=2016-10-05 22:29:37 


16.3.5 ”数据库 更 新 


下 面 的 示例 将 EMPLOYEE 表 中 SEX 字段 值 为 'M' 的 记录 的 AGE 字段 值 增 加 1: 


#! /usr/bin/python 
# -*-coding:UTF-8-*- 
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import pymysql 
def update table(): 
# 打开 数据 库 连 接 


db= pymysql.connect("localhost", "root", "root", "test") 


# 使 用 cursor() 方 法 获取 操作 游标 
cursor = db.cursor() 
# SQL 更 新 语句 
sql = "UPDATE EMPLOYEE SET AGE = AGE + 1 WHERE SEX = '%s" % 'M' 
try: 
# 执行 SQL 语句 
cursor.execute(sql) 
# 提交 到 数据 库 执行 
db.commit() 
print("UPDATE SUCCESS.") 
except Exception as e: 
print(‘UPDATE MySQL table failed.Case:%s' % e) 
# 发 生 错误 时 回 深 
db.rollback() 
finally: 
# 关闭 数据 库 连 接 
db.close() 





def main(): 
update_table() 


if_ name ==" main 


main() 
执行 结果 如 下 : 
UPDATE SUCCESS. 


从 MySQL 客户 端 查看 更 新 结果 ， 如 图 16-3 所 示 。 可 以 发 现 ，AGE 变 为 23 了 。 


1 FIRST_NAME 


Me 





图 16-3 表 更 新 结果 
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16.3.6 ”数据 库 删 除 


删除 操作 用 于 删除 数据 表 中 对 应 的 数据 。 
下 面 演示 删除 数据 表 EMPLOYEE 中 AGE 大 于 22 的 所 有 数据 。 


#! /usr/bin/python 
#-*-coding:UTF-8-*- 


import pymysql 


def delete_record(): 
# 打开 数据 库 连 接 


db= pymysql.connect("localhost", "root", "root", "test") 


# 使 用 cursor() 方 法 获取 操作 游标 


cursor = db.cursor() 


# SQL 删除 语句 
sql= "DELETE FROM EMPLOYEE WHEREAGE > %d" % 22 
try: 
# 执行 SQL 语句 
cursor.execute(sql) 
# 提交 修改 
db.commit() 
print("DELETE SUCCESS.") 
except Exception as e: 
print("DELETE RECORD FAILED.Case:%s" % e) 
# 发 生 错误 时 回 滚 
db.rollback() 
finally: 
# 关闭 连接 
db.close0 


def main(): 
delete_record() 


DELETE SUCCESS. 
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从 MySQL 客户 端 查看 删除 结果 ， 如 图 16-4 所 示 。 可 以 看 到 ， 之 前 插入 的 一 条 数据 被 删 
除了 。 


ysql> select < from employee; 
Empty set 0.00 sec> 





ysql> 
图 164 记录 删除 


16.4 事 务 


有 务 机 制 可 以 确保 数据 的 一 致 性 。 
有 务 具有 4 个 属性 : 原子 性 、 一 致 性 、 隔 离 性 、 持久 性 , 这 4 个 属性 通常 称 为 ACID 特性 。 


e 原子 性 (Atomicity ) : 一 个 事务 是 一 个 不 可 分 割 的 工作 单位 ， 事 务 中 的 所 有 操作 要 么 都 





je ll 


做 ， 要 么 都 不 做 。 
e@ 一 致 性 (Consistency ) : 事务 必须 使 数据 库 从 一 个 一 致 性 状态 变 为 另 一 个 一 致 性 状态 。 
一 致 性 与 原子 性 是 密切 相关 的 。 


e 隔离 性 (Isolation ) : 一 个 事务 的 执行 不 能 被 其 他 事务 干扰 。 也 就 是 一 个 事务 内 部 的 操作 
及 使 用 的 数据 对 并 发 的 其 他 事务 是 隔离 的 ， 并 发 执行 的 各 个 事务 之 间 不 能 互相 干扰 。 

e@ 持久 性 (Durability ) : 持续 性 也 称 永久 性 (Permanence ) ， 指 一 个 事务 一 旦 提交 ， 它 对 
数据 库 中 数据 的 改变 就 应 该 是 永久 性 的 。 接 下 来 其 他 操作 或 故障 不 应 该 对 其 有 任何 影响 。 


Python DB-API 2.0 的 事务 提供 了 两 个 方法 ， 即 commit 和 rollback。 前 面 删除 方法 中 的 一 
段 代 码 就 使 用 了 事务 〈 前 面 的 插入 、 更 新 都 使 用 了 事务 ) : 
# SQL 删除 记录 语句 
ql="DELETE FROM EMPLOYEE WHERE AGE > %d" % 22 
try: 
# 执行 SQL 语句 
cursor.execute(sql) 
# 提交 修改 
db.commit() 
print("DELETE SUCCESS.") 
except Exception as e: 
print("DELETE RECORD FAILED.Case:%s" % e) 
# 发 生 错误 时 回 滚 
db.rollback() 
finally: 
# 关闭 连接 
db.close0 
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在 Python 数据 库 编程 中 ， 支 持 事务 的 数据 库 在 游标 建立 时 会 自动 开始 一 个 隐形 数据 库 
事务 。 

commit() 方 法 提交 所 有 更 新 操作 ，rollback() 方 法 回 滚 当前 游标 的 所 有 操作 。 每 一 个 方法 都 
开启 一 个 新 事务 。 


16.5 调 试 


初学 者 跟 数据 库 打 交道 时 很 容易 碰 到 形形色色 的 问题 ， 可 能 一 个 非常 简单 的 问题 也 会 导 
致 你 无 法 找到 问题 所 在 。 此 时 我 们 需要 处 理 以 下 几 个 问题 : 


(1) 程序 中 有 没有 我 们 期 望 去 做 却 没有 实现 的 功能 ?找到 运行 该 功能 的 代码 ， 并 确保 这 
段 代码 如 你 所 期 望 地 运行 了 。 

(2) 程序 中 有 没有 运行 某 种 不 该 出 现 的 功能 的 代码 ? 

(3) 有 没有 一 段 代码 产生 的 效果 和 你 所 期 望 的 不 一 致 ? 确保 你 完全 明白 这 段 代码 ， 特 别 
是 牵涉 对 其 他 Python 模块 的 函数 或 方法 调用 时 。 阅 读 调用 到 的 函数 的 文档 。 使 用 简单 的 测试 
用 例 测 试 它们 并 检查 结果 。 


为 了 能 够 编程 ， 我 们 需要 对 程序 如 何 工作 有 一 个 思维 模型 。 如 果 编 写 了 一 段 和 你 预料 不 
同 的 代码 ， 常 常 问题 在 于 你 的 思维 模型 。 

修正 思维 模型 的 最 佳 方法 是 将 程序 划分 成 不 同 部 分 (通常 是 函数 和 方法 ) ， 并 独立 测试 
每 一 个 部 分 。 一 旦 找到 模型 和 真实 世界 的 偏差 ， 就 能 够 解决 问题 。 

在 开发 过 程 中 应 当 分 组 件 进行 构建 和 测试 。 当 发 现 一 个 问题 时 ， 只 需要 检查 一 小 部 分 不 
确认 是 否 正确 的 代码 即 可 。 


16.6 ”问题 解答 


(1) Python 新 手 入 门 使 用 哪 种 数据 库 比较 好 ? 

答 : 建议 使 用 MySQL， 现 在 中 小 企业 用 得 多 ， 大 企业 也 在 用 。MySQL 免费 、 开 源 ， 而 
且 好 用 ， 比 其 他 企业 级 数据 库 轻 量 了 不 少 。 

(2) 实际 应 用 开发 中 ， 数 据 库 操作 用 得 多 吗 ? 

答 : 数据 库 作 为 数据 存储 的 基本 载体 ， 在 信息 时 代 是 信息 系统 中 最 基本 的 组 成 部 分 。 正 
如 本 章 所 说 的 , 文件 能 存储 数据 , 但 是 存储 能 力 有 限 ， 而 数据 库 无 论 对 任何 规格 的 数据 ， 存储 
能 力 都 远 在 文件 之 上 。 数 据 库 一 般 有 标准 API， 访问 比较 快速 和 高 效 。 在 实际 应 用 中 ， 对 数据 
的 操作 基本 优先 考虑 使 用 数据 库 。 
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16.7 温 故 知 新 ， 学 以 致 用 


本 章 主要 介绍 了 创建 和 关系 型 数据 库 交 互 的 Python 程序 。 在 本 章 结束 前 回顾 一 下 学 到 的 


(1) Python DB-API 提供 了 哪些 简单 、 标 准 化 的 接口 ? 

(2) 数据 库 的 增 、 删 、 改 、 查 怎么 操作 ? 

(3) 什么 叫 事务 ， 事 务 有 哪些 特性 ? 

尝试 思考 并 解决 如 下 问题 : 

(1) 创建 一 张 表 ， 自 己 定义 字段 ， 字 段 尽量 包含 多 种 类 型 。 

(2) 向 表 中 插入 多 条 数据 ， 并 尝试 从 文件 中 读 取 数 据 插入 数据 库 。 
(3) 对 某 些 字段 进行 求 和 、 求 平均 值 、 分 组 、 排 序 等 操作 。 


入 





< 


LA 页 目 实战 一 民 由 


前 面 章节 讲述 了 Python 中 的 基础 知识 ， 接 下 来 使 用 所 
学 的 知识 进行 实战 练习 。 本 章 将 讲解 一 个 实战 项 目 一 一 假 忠 
的 实现 。 





A 
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17.1 了 解 候 虫 


疏 虫 《网 络 朴 虫 ) ， 大 家 可 以 理解 为 在 网 络 上 疏 行 的 一 种 蜘蛛 ， 互 联网 就 像 一 张大 网 ， 
候 虫 就 是 在 这 张 网 上 的 来 仆 去 的 蜂 蛛 。 如 果 扑 虫 遇 到 资源 , 就 会 将 资源 抓 取 下 来 。 至 于 抓 取 什 
么 资源 ， 这 个 由 用 户 控 制 。 

例如 ， 疏 虫 抓 取 了 一 个 网 页 ， 在 这 个 网 中 发 现 了 一 条 道路 ， 也 就 是 指向 网 页 的 超 链接 ， 
它 就 可 以 爬 到 另 一 张 网 上 获取 数据 。 这 样 ， 整 个 连 在 一 起 的 大 网 对 这 只 蜘蛛 来 说 触手 可 及 ,分 
分 钟 候 下 来 不 是 事 儿 。 

在 用 户 浏览 网 页 的 过 程 中 ， 我 们 可 能 会 看 到 许多 好 看 的 图 片 ， 比 如 输入 百度 的 网 址 进入 首 
页 后 ,我 们 会 看 到 几 张 图 片 和 百度 搜索 框 ， 其实 是 在 用 户 输入 网 址 后 ,经 过 DNS 服务 器 找到 服 
务 器 主机 ， 向 服务 器 发 出 一 个 请 求 ， 经 过 服务 器 解析 后 ， 发 送 给 用 户 浏览 器 HTML、JS、CSS 
等 文件 ， 再 经 过 浏览 器 解析 ， 用 户 便 可 以 看 到 形形色色 的 图 片 了 。 

用 户 看 到 的 网 页 实质 是 由 HTML 代码 构成 的 ， 疏 虫 想来 的 便 是 这 些 内 容 ， 通 过 分 析 和 过 
滤 这 些 HTML 代码 ， 实 现 对 图 片 、 文 字 等 资源 的 获取 。 

在 资源 抓 取 过 程 中 需要 使 用 URL 做 资源 定位 。URL (统一 资源 定位 符 ) 就 是 我 们 说 的 网 
址 , 统一 资源 定位 符 是 对 可 以 从 互联 网 上 得 到 资源 位 置 和 访问 方法 的 一 种 简洁 的 表示 , 是 互联 
网 上 标准 资源 的 地 址 。 互 联网 上 每 个 文件 都 有 唯一 的 URL，URL 包含 的 信息 指出 文件 的 位 置 
和 浏览 器 应 该 怎么 处 理 这 个 URL。 

URL 的 格式 由 3 部 分 组 成 : 

(1) 协议 〈 服 务 方式 ) 。 

(2) 存 有 该 资源 的 主机 IP 地 址 《有 时 也 包括 端口 号 ) 。 

(3) 主机 资源 的 具体 地 址 ， 如 目录 和 文件 名 等 。 


疏 虫 疏 取 数据 时 必须 有 目标 URL 才 可 以 获取 数据 ， 因 此 URL 是 爬虫 获取 数据 的 基本 依 
据 ， 准 确 理解 URL 的 含义 对 学 习 爬 虫 有 很 大 帮助 。 


17.2 ”爬虫 的 原理 


爬虫 的 原理 是 ， 从 一 个 起 始 种 子 链接 开始 ， 发 送 http 请 求 这 个 链接 ， 得 到 该 链接 中 的 内 
容 , 然后 大 多 正则 匹配 页 面 里 的 有 效 链 接 ， 然后 将 这 些 链接 保存 到 待 访 问 队列 中 ,等 待 候 取 线 
程 取 这 个 待 访问 队列 , 一 旦 链接 已 访问 , 为 了 有 效 减 少 不 必 要 的 网 络 请 求 , 我们 把 已 访问 的 链 
接 放 到 已 访问 Map 中 ,防止 重复 抓 取 和 死 循 环 。 以 上 提 到 的 过 程 是 一 个 比较 简单 的 假 虫 实现 ， 
还 有 更 复杂 的 爬虫 实现 ， 如 需要 使 用 代理 服务 器 、 伪 装 成 浏览 器 、 登 录 和 提取 验证 码 等 。 这 里 
面 有 几 个 概念 ， 一 个 是 发 http 请 求 ， 一 个 是 正则 匹配 你 感 兴趣 的 链接 。 

爬 虫 的 原理 相对 简单 ， 仆 取 网 页 的 基本 步骤 如 下 : 
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ERi) 和 人工 给 定 一 个 URL 作为 入 口 ， 从 这 里 开始 扑 取 . 
万 维 网 的 可 视图 呈 蝴 蝶 型 ， 网 络 候 虫 一 般 从 蝴蝶 型 左边 结构 出 发 。 这 里 有 一 些 门户 网 站 的 主页 , 而 门 
户 网 站 中 包含 大 量 有 价值 的 链接 。 

人 62 用 运行 队列 和 完成 队列 保存 不 同 状态 的 链接 。 
对 于 大 型 数据 而 言 ， 内 存 中 的 队列 是 不 够 的 ,通常 采用 数据 库 模拟 队列 。 用 这 种 方法 既 可 以 进行 海量 
的 数据 抓 取 ， 又 可 以 拥有 断 点 续 抓 功能 . 

C103 线程 从 运行 队列 读 取 队 首 URL， 如 果 存 在 ， 就 继续 执行 ， 反 之 停止 代 取 . 

人 64 每 处 理 完 一 个 URL ， 将 其 放 入 完成 队列 ， 防 止 重复 访问 。 

C05 每 次 抓 取 网 页 之 后 分 析 其 中 的 URL， 将 经 过 过 滤 的 合法 链接 写 入 运行 队列 ,等待 提取 。 

《EX56 ED. Es. EPs. 








17.3” 息 虫 常用 的 几 种 技巧 


Python 的 网 络 息 取 方式 有 很 多 种 ， 下 面 介绍 常用 的 儿 种 网 络 息 取 的 方式 。 
17.3.1 基本 方法 


Python 中 最 基本 的 网 络 爬 取 几 行 代码 就 可 以 实现 ,只 需 使 用 urllib 模块 中 的 request 即 可 。 
我 们 在 第 15 章 网 络 编程 中 已 经 有 相关 实现 ， 代 码 如 下 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 


from urllib import request 


response = request.urlopen("https://movie.douban.com/") 

content = response.read().decode(utf8) 

print(content) 

结果 可 以 输出 许多 带 html 样式 的 文本 , 大 部 分 都 是 无 用 的 信息 。 这 种 方式 虽然 非常 简单 ， 
但 抓 取 到 的 信息 没有 经 过 加 工 处 理 ， 所 以 没有 多 大 用 处 。 


17.3.2 ”使 用 代理 服务 器 


为 什么 要 使 用 代理 服务 器 ? 

当前 很 多 网 站 都 有 反扑 虫 机 制 ， 一 旦 发 现 某 个 IP 在 一 定时 间 内 请 求 次 数 过 多 或 请 求 频率 
太 高 ， 就 可 能 将 这 个 IP 标记 为 恶意 IP， 从 而 限制 这 个 IP 的 访问 , 或 者 将 这 个 IP 加 入 黑 名 单 ， 
使 之 不 能 继续 访问 该 网 站 。 

这 时 我 们 需要 使 用 代理 服务 器 ， 通 过 使 用 不 同 的 代理 服务 器 继续 抓 取 需要 的 信息 。 示 例 
代码 如 下 : 


#! /usr/bin/python3 
# -#- coding:UTF-8 -*- 
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from urllib import request 

proxy_support = request.ProxyHandler( {'http':'http://XX.XX.XX.XX:xx'} ) 
opener = request.build_opener(proxy_support, request.HTTPHandler) 
request.install_opener(opener) 


content = request.urlopen('https://movie.douban.com/").read().decode('utf-8") 

print(content) 

和 基本 方法 一 样 ， 这 样 朴 取 的 信息 没有 经 过 处 理 ， 得 到 的 结果 也 没有 多 大 用 处 ， 需 要 进 

- 步 加 工 后 才能 体现 价值 。 

17.3.3 ”cookie 处 理 

对 于 安全 级 别 稍微 高 一 点 的 网 站 ， 使 用 前 两 个 方法 都 无 法 朴 取 数据 。 这 些 网 站 需要 在 发 
送 URL 请 求 时 提供 cookie 信息 ， 和 否则 无 法 请 求 成 功 。 示 例 代码 如 下 : 

#! /usr/bin/python3 

#-*- coding:UTF-8 -*- 

from urllib import request 

from http import cookiejar 

cookie_support = request.HTTPCookieProcessor(cookiejar.CookieJar()) 

opener = request.build_opener(cookie_support, request.HTTPHandler) 

request.install_opener(opener) 

content = request.urlopen('https://movie.douban.com/").read(.decode('utf-8") 

print(content) 

当然 ， 这 也 是 一 种 简单 的 方式 ， 还 可 以 扩展 为 更 复杂 的 模式 。 
17.3.4 ”伪装 成 浏览 

当前 很 多 网 站 都 有 反 息 虫 机 制 ， 对 于 息 虫 请 求 会 一 律 拒绝 。 

程序 怎样 区 分 一 个 请 求 是 正常 请 求 还 是 疏 虫 程序 发 出 的 请 求 呢 ? 

程序 通过 判断 发 送 请 求 中 是 否 有 浏览 器 信息 判断 一 个 请 求 是 否 为 正常 请 求 。 当 访问 有 反 
疏 虫 机 制 的 网 站 时 ， 我 们 在 请 求 中 设置 浏览 器 信息 〈 伪 装 成 浏览 器 ) ， 通 过 修改 http 包 中 的 
header 实现 。 示 例 代 码 片段 如 下 : 


postdata = parse.urlencode({}) 





headers={ 
"User-Agent':Mozilla/$.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 
Firefox/3.5.6' 


} 
req = request.Request( 
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url = 'https://www.zhihu.com/', 
data = postdata, 
headers = headers 
) 
通过 在 headers 中 设置 浏览 器 信息 ， 并 将 headers 放 入 request 请 求 中 ， 就 可 以 伪装 成 济 
览 器 。 


17.3.5” 登 录 


对 于 当前 大 部 分 网 站 来 说 ， 登 录 是 必 不 可 少 的 。 
我 们 平常 登录 都 是 在 浏览 器 上 进行 的 ， 其 实 是 通过 浏览 器 向 对 应 服务 器 发 送 登 录 请 求 ， 
服务 器 验证 通过 后 再 向 浏览 器 发 送 登录 成 功 信息 , 并 将 页 面 转向 登录 成 功 页 面 ,展现 相关 内 容 。 
使 用 爬虫 程序 登录 时 ， 其 实 就 是 模仿 浏览 器 发 送 登录 请 求 ， 将 登录 需要 的 用 户 名 和 密码 
放 到 请 求 数据 中 。 请 求 数 据 大 致 形式 如 下 : 
postdata = parse.urlencode( { 
‘username':"XXXXX', 
‘password':"XXXXX', 
‘continueURT':http://www.verycd.com/', 
‘fk':fkasdfasdf, 
"|ogin_submit:' 登 录 '， 
) 
构建 好 请 求 数据 后 ， 再 将 构建 数据 放 入 请 求 中 ， 代 码 片 段 如 下 : 
req = request.Request( 
url = 'https://www.zhihu.com/', 
data = postdata 


) 
content = request.urlopen(req).read() 


print(content) 
通过 这 种 方式 可 以 模拟 浏览 器 登录 相关 网 站 。 当 然 ， 还 有 不 少 网 站 需要 验证 码 ， 这 时 需 
要 编写 获取 验证 码 的 程序 。 这 方面 本 书 不 做 讨论 ， 有 兴趣 的 读者 可 以 自己 查阅 相关 资料 。 


17.4 有 爬虫 示例 一 一 抓 取 豆 淤 电影 Top250 影评 数据 


前 面 我 们 讲解 了 疏 虫 的 一 些 概念 和 技巧 ， 本 节 通 过 一 个 完整 的 示例 一 一 抓 取 豆瓣 电影 
Top250 影评 数据 介绍 爬虫 的 使 用 。 
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17.4.1 ”确定 URL 格式 


我 们 先 来 观察 豆 斩 电影 Top250 任意 一 页 URL 地 址 的 格式 。 先 观察 第 一 页 , 可 以 看 到 URL 
地 址 为 :https://movie.douban.com/top250?start=25&filter=。 这 一 页 展示 了 25 条 豆 关 影评 数据 ， 
我 们 分 析 一 下 这 个 地 址 。 
https:// 代表 资源 传输 使 用 https 协议 。 
movie.douban.com 是 豆 关 的 二 级 域名 ， 指 向 豆 关 的 服务 器 。 
/top250 是 服务 器 的 某 个 资源 ， 即 豆 状 电影 Top250 的 地 址 定位 符 。 
start=25&filter= 是 该 URL 的 两 个 参数 ， 分 别 代表 从 多 少 条 记录 开始 展示 和 过 滤 条 件 。 


在 实际 开发 中 ， 为 了 更 好 地 与 开发 应 用 结合 ， 我 们 一 般 将 URL 分 为 两 部 分 ， 一 部 分 为 基 
础 部 分 ， 是 不 可 变 部 分 ， 另 一 部 分 为 参数 部 分 ， 是 可 变 部 分 。 

例如 ， 上 面 的 URL 可 以 划分 为 基础 部 : https:/movie.douban.com/top250， 参 数 部 分 : 
2start=25&filter=。 


17.4.2 ”页面 抓 取 


熟悉 了 URL 的 格式 ， 下 面 用 urllib 库 试 着 抓 取 页 面 内 容 。 

我 们 以 面向 对 象 的 编码 方式 编写 这 个 页 面 抓 取 程 序 。 定 义 一 个 类 名 MovieTop， 在 类 中 定 
义 一 个 初始 化 方法 和 一 个 获取 页 面 的 方法 。 

我 们 把 一 些 基 本 信息 的 参数 初始 化 放 在 类 的 初始 化 中 ， 即 init 方法 。 另 外 ， 获 取 页 面 的 方 
法 , 我 们 需要 知道 从 第 几 条 记录 开始 查找 、 每 次 查找 多 少 条 记录 。 在 这 个 方法 中 需要 一 个 循环 ， 
通过 循环 抓 取 需要 的 记录 。 

初步 构建 基础 代码 如 下 : 

class MovieTop(object): 

def _init (self): 
selfstart=0 


self.param= '&filter=" 
self.headers = {'User-Agent': "Mozilla/$.0 (Windows NT 6.1; WOW64)} 


def get_page(self): 
page_content = 
try: 
while self.start <= 225: 

url = 'https://movie.douban.com/top250?start=" + str(self.start) 
req= request.Request(url, headers = self.headers) 
response = request.urlopen(req) 
page = response.read().decode('utf-8") 
page num = (self.start + 25)//25 
print(' 正 在 抓 取 第 ' + str(page_num) + ' 页 数据 ..…' ) 
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selfstart += 25 
page_content.append(page) 
return page_content 
except request.URLError as e: 
if hasattr(e, reason'): 
print(' 抓 取 失 败 ， 失 败 原因 : ', e.reason) 


def main(self): 
print( 开 始 从 豆瓣 电影 抓 取 数据 …….') 
self.get_page() 
Print( 数 据 抓 取 完 毕 .…) 


在 这 个 初步 构建 的 程序 中 ， 我 们 只 指定 了 一 些 数 据 仆 取 参数 ， 对 于 有 息 取 的 数据 并 没有 做 
任何 处 理 ,也 没有 保存 息 取 数据 。 该 程序 可 以 校 验 该 假 虫 程序 是 否 可 以 正确 运行 。 至 于 运行 结 
果 如 何 处 理 ， 后 续 章节 会 继续 深入 介绍 。 


17.4.3 ”提取 相关 信息 


当前 我 们 抓 取 的 数据 阅读 起 来 颇 为 不 便 ， 有 息 取 的 数据 中 有 许多 HTML 格式 的 文本 。 我 们 
是 否 可 以 过 滤 这 些 HTML 格式 的 文本 呢 ? 

Python 中 的 re 模块 为 我 们 提供 了 一 个 compile 函数 ， 该 函数 可 以 帮助 我 们 把 正则 表达 式 
语法 转化 成 正则 表达 式 对 象 。 

先 看 一 个 简单 示例 : 

html text = '<p class="name"> 导 演 : 冯小刚 </p>' 

TeObj = re.compile(u'<p.*?class="name"> 导 演 : (.*?)</p>.*2) 

print(reObj.findall(html_text)) 


执行 这 段 程序 ， 输 出 结果 如 下 : 

[冯小刚 ] 

由 执行 结果 得 知 ， 本 应 该 在 HTML 标签 中 的 文本 ， 经 过 compile 函数 处 理 后 ， 最 后 得 到 
了 一 个 列表 ， 里 面包 含 一 个 名 字 ， 而 将 其 他 干扰 信息 过 滤 了 。 这 就 是 我 们 使 用 re 模块 中 的 
compile 函数 结合 正则 表达 式 得 到 的 。 

在 compile 函数 处 理 表达 式 中 ， 有 3 个 字符 需要 说 明 ， 这 3 个 字符 是 re 正则 表达 式 中 的 
语法 字符 。 

e “”， 代 指 任何 字符 。 

“#?” ， 代 指 0 个 或 多 个 字符 ( 贪 禁 匹 配 ) 。 

e “2?”， 代 指 0 个 或 多 个 字符 ( 贪 禁 匹配 ) 。 

更 多 相关 字符 可 以 查看 re 模块 中 正则 表达 式 的 语法 字符 。 

下 面 看 一 个 更 复杂 的 示例 : 


.347 。 
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html text = '<p class="info"> 导 演 : 陈凯歌 Kaige Chen&nbsp;&nbsp;&nbsp;'\ 
主演 : 张国荣 Leslie Cheung / 张丰毅 Fengyi Zha...<br>'\ 
"1993&nbsp;/&nbsp; 中 国 大 陆 香港 &nbsp;/&nbsp; 剧 情 爱情 </p>' 
# s='<span>740137 人 评价 </span>' 
TeObjl = re.compile(u'<p.*?class="info"> 导 演 : (.*?)' 
+ u'&nbsp;&nbsp;&nbsp;.*?<br>" 
+ u'\(.*?)&nbsp;/&nbsp;(.*?)' 
+ u'&nbsp;/&nbsp;(.*?)</p>.*?") 
Pprint(reObj1 .findall(html_text)) 
程序 执行 结果 如 下 : 
[陈凯歌 Kaige Chen', "1993, 中 国 大 陆 香港 "剧情 爱情 
从 执行 结果 看 到 , 通过 这 种 方式 可 以 从 一 长 串 杂 乱 的 HTML 文本 中 提取 一 些 精炼 的 信息 。 
在 MovieTop 类 中 ， 我 们 可 以 用 面向 对 象 的 思路 提取 一 个 专门 做 HTML 文本 解析 的 方法 ， 
从 而 从 文本 中 解析 出 我 们 所 关注 的 内 容 。 在 该 类 中 我 们 定义 一 个 方法 ， 形 式 如 下 : 
def get_movie_info(self): 
pattern = re.compile(u'<div.*?class="item">.*?°....) 


17.4.4 ” 写 入 文件 
写 入 文件 的 过 程 很 简单 ， 主 要 代码 如 下 : 


file_top = open(selffile_ path 'w', encoding='utf-8) 


file_top.write(obj) 

文件 写 入 的 细节 我 们 在 第 12 章 已 经 详细 介绍 过 , 读者 若 不 明白 可 以 再 次 阅读 这 一 章 内 容 。 
在 该 示例 中 , 我 们 编写 一 个 方法 专门 用 于 文件 的 写 入 操作 , 使 得 程序 面向 对 象 化 。 在 MovieTop 
类 中 定义 一 个 方法 : 

def write_text(self): 


print(' 开 始 向 文件 写 入 数据 ………') 
file top = open(self.file_path, 'w', encoding='utf-8) 


17.4.5 ”完善 代码 


经 过 前 面 的 一 番 准 备 ， 下 面 完善 这 个 朴 虫 程序 ， 将 疏 取 到 的 相关 信息 保存 到 D 盘 的 
movie_spider.txt 文件 中 。 完 整 代码 如 下 : 


#! /usr/bin/python3 
#-*- coding:UTF-8 -*- 
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from urllib import request 
from common.mysql_client import * 
import re 


class MovieTop(object: 
def _init (self): 
self.start =0 
self.param= '&filter=" 


self.headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64)'} 


self.movie list= [] 


self.file_path = 'D:\movie_spider.txt' 


def get_page(self): 
try: 


url = 'https://movie.douban.com/top250?start=' + str(self start) 
req = request.Request(url, headers = self.headers) 

response = request.urlopen(req) 

page = response.read().decode('utf-8') 

page num = (self.start + 25)//25 

print(' 正 在 抓 取 第 ' + str(page_num) + ' 页 数据 … ) 


self.start += 25 
return page 


except request.URLError as e: 


if hasattr(e, reason'): 


print(' 抓 取 失 败 ， 失 败 原 因 : ', e.reason) 


def get_movie_info(self): 


pattern = re.compile(u'<div.*?class="item">.*?' 


+ u'<div.*?class="pic">.*2' 

+ u'<em.*?class="">(.*?)</em>.*7' 

+ u'<div.*?class="info">.*?" 

+ u'<span.*?class="title">(.*?)" 

+ u'</span>.*?<span.*?class="title">(.*?)</span>.*?' 
+ u'<span.*?class="other">(.*?)</span>.*?</a>.*7" 
+ u'<div.*?class="bd">.*?<p.*?class="">.*2' 

+ 导演 : (.*?)&nbsp;&nbsp;&nbsp;.*?<br>' 

+ uu'(.*?7)&nbsp;/&nbsp;(.*?)&nbsp;/&nbsp;' 

+ u'(.*?)</p>.*?<div.*?class="star">.*?7' 

+ u'<span.*7' 

+ u'class="rating num".*?property="V:average">" 
+u'(.*7)</span>.*7' 

二 UW'.*?<span>(.*?) 人 评价 </span>.*7' 
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+u'<p.*?class="quote">.*7" 
+u'<span.*?class="ing">(.*?)' 
+u'</span>.*?</p>", re.S) 


While self.start <= 225: 

page = self.get_page() 

movies = re.findall(pattern, page) 

for movie in movies: 

self.movie list.append([movie[0], movie[1], 

movie[2].lstrip('&nbsp;/&nbsp:'), 
movie[3].lstrip('&nbsp;/&nbsp;'), 
movie[4], 
movie[5].lstrip(), 
movie[6], 
movie[7].rstrip(), 
movie[8], 
movie[9], 
movie[10]]) 


def write_text(self): 
print(' 开 始 向 文件 写 入 数据 …… | 
file_top = open(self.file_path, 'w', encoding='utf-8) 
try: 
for movie in self.movie list: 
file_top.write(' 电 影 排 名 : ' +movie[0] + we) 
file_top.write(' 电 影 名 称 :' +movie[1] + wem) 
file_top.write(' 外 文 名 称 :'+movie[2] + wem) 
file_top.write(' 电 影 别 名 : '+ movie[3] + \r\n') 
file_top.write(' 导 演 姓名 : '+movie[4] + wem) 
file_top.write(' 上 映 年 份 : '+ movie[5] + \r\n') 
file_top.write(' 制 作 国 家 /地 区 :'+ movie[6] + wen) 
file_top.write(' 电 影 类 别 :'+ movie[7] + An) 
file_top.write(' 电 影评 分 : '+ movie[8] + en) 
file_top.write(' 参 评 人 数 :'+movie[9] + wen) 
file_top.write(' 简 短 影 评 : '+ movie[10] + \rnwn') 
print( 抓 取 结果 写 入 文件 成 功 ..…) 
except Exception as e: 
print(e) 
finally: 
file_top.close() 





项 目 实战 一 疏 虫 第 /7 党 





def main(self): 
print( 开 始 从 豆瓣 电影 抓 取 数据 .……') 
self.get_ movie_info() 
self.write_text() 
print( 数 据 抓 取 完毕 .…) 


dou ban spider = MovieTop() 
dou_ban spider.main() 


执行 这 段 程序 ， 会 在 D 盘 中 生成 movie_spider.txt 文件 ， 会 在 该 文件 中 写 入 从 网 站 上 的 取 
到 的 相关 信息 ， 里 面 保 存 的 字符 格式 就 是 我 们 在 程序 中 定义 的 格式 。 大 致 形式 如 下 : 
电影 排名 : 1 


电影 名 称 : 肖申克 的 救赎 

外 文 名 称 : The Shawshank Redemption 

电影 别名 : 月 黑 高 飞 ( 港 ) / 刺激 1995( 台 ) 
导演 姓名 : 弗兰克 。 德 拉 邦 特 Frank Darabont 
上 映 年 份 : 1994 

制作 国家 /地 区 : 美国 

电影 类 别 : 犯罪 剧情 

电影 评分 : 9.6 

参评 人 数 : 740538 


简短 影评 : 希望 让 人 自由 。 
17.5 “本 章 小 结 


本 章 通 过 一 个 扑 虫 程序 将 前 面 所 学 的 知识 用 于 实战 。 所 用 示例 为 方便 理解 ， 没 有 使 用 伪 
装 浏览 器 和 登录 的 知识 。 学 有 余力 的 读者 可 以 查看 一 些 爬 虫 框 染 ， 如 比较 通用 的 scrapy 框架 。 





CeA 项 目 实战 一 数据 分 析 


我 们 在 第 17 章 利 用 礁 虫 将 抓 取 的 数据 写 入 了 文本 文件 
中 。 不 过 在 文件 中 操作 数据 ， 进 行 数据 分 析 很 不 方便 。 本 章 
将 介绍 如 何 将 抓 取 的 数据 写 入 数据 库 中 , 并 通过 操作 数据 库 
中 的 数据 体现 其 价值 。 

本 章 将 结合 大 数据 的 相关 思维 , 使 用 已 有 数据 做 一 些 简 
单 的 数据 分 析 。 





A 
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18.1 数据 持久 化 


我 们 使 用 第 17 章 数据 抓 取 的 示例 进行 讲解 。 第 17 章 将 抓 取 的 数据 写 入 一 个 tt 文件 中 ， 
通过 这 种 方式 将 数据 持久 化 。 

这 种 方式 有 一 个 缺点 ， 不 能 很 好 地 对 获取 的 数据 进行 进一步 操作 。 如 果 直 接 打开 txt 文 件 
查看 ， 查 看 到 的 数据 有 限 ， 而 且 看 起 来 不 直观 。 当 文件 比较 大 时 ， 打 开 txt 文件 也 不 太 容易 。 

当然 ， 我 们 可 以 通过 写 程序 将 文件 内 容 读 到 内 存 中 ， 再 通过 程序 操作 数据 。 如 果 不 考虑 
内 存 的 限制 和 写 出 专门 用 于 操作 数据 的 代码 需要 的 时 间 , 这 种 方法 就 可 以 使 用 。 和 否则 我 们 将 会 
遇 上 各 种 各 样 的 问题 ， 如 内 存 滋 出 、 数 据 不 同步 等 。 

对 于 这 些 问 题 ， 有 没有 解决 方法 呢 ? 

答案 是 有 。 其 实 我 们 可 以 将 获取 的 数据 保存 到 数据 库 中 ， 再 通过 数据 库 操作 获取 的 数据 。 
这 样 不 但 在 现 阶 段 解决 了 内 存 溢出 的 问题 ， 还 可 以 将 更 多 数据 处 理 的 问题 交 给 数据 库 解决 。 

我 们 把 数据 插入 数据 库 中 称 为 数据 持久 化 。 

数据 持久 化 狭义 地 理解 为 把 域 对 象 永久 保存 到 数据 库 中 ， 也 就 是 将 内 存 中 的 数据 模型 转 
换 为 存储 模型 、 将 存储 模型 转换 为 内 存 中 的 数据 模型 的 统称 。 

数据 持久 化 广义 的 理解 包括 和 数据 库 相 关 的 各 种 操作 ， 主 要 有 以 下 5 种 : 


保存 ， 把 域 对 象 永久 保存 到 数据 库 。 

更 新 ， 更 新 数据 库 中 域 对 象 的 状态 。 

删除 ， 从 数据 库 中 删除 一 个 域 对 象 。 

加 载 ， 根 据 特定 的 识别 元 素 ， 把 一 个 域 对 象 从 数据 库 加 载 到 内 存 。 

查询 ， 根 据 特定 查询 条 件 ， 把 符合 条 件 的 一 个 或 多 个 域 对 象 从 数据 库 加 载 到 内 存 。 


接 下 来 看 怎么 将 抓 取 的 数据 插入 数据 库 。 我 们 把 原来 将 数据 写 入 文件 的 操作 更 换 为 将 数 
据 写 入 数据 库 。 
首先 创建 一 张 表 ， 此 处 将 表 命 名 为 douban_comment。 表 创建 语句 和 表 结 构 如 下 : 


CREATE TABLE ‘douban comment ( 
"Id' int(11) NOT NULL AUTO_INCREMENT, 
‘movieRank’ varchar(20) DEFAULT NULL, 
movieName' varchar(50) DEFAULT NULL, 
'movieForName’ varchar(50) DEFAULT NULL, 
‘movieAlias' varchar(100) DEFAULT NULL, 
"directorName' varchar(50) DEFAULT NULL, 
'showYear varchar(50) DEFAULT NULL, 
makeCounty' varchar(100) DEFAULT NULL. 
movieType' varchar(100) DEFAULT NULL, 
‘movieScore' varchar(10) DEFAULT NULL, 
'scoreNum' varchar(20) DEFAULT NULL, 


“353“。 
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'shortFilm"' varchar(255) DEFAULT NULL., 
PRIMARY KEY (‘1d’) 
) ENGINE=InnoDB AUTO INCREMENT=725 DEFAULT CHARSET=utf8; 


在 MySQL 中 执行 该 脚本 ， 即 可 生成 表 。 
接 下 来 在 代码 中 加 入 将 数据 写 入 数据 库 的 方法 ， 方 法 如 下 : 


def insert_into_mysql(self): 
db= pymysql.connect("localhost", "root", "root", "test") 
# 使 用 cursor() 方法 创建 一 个 游标 对 象 cursor 
cursor = db.cursor() 
insert_str = "insert into douban_comment(movieRank,movieName," \ 
"movieForName,movieAlias,directorName,show Year," \ 
"makeCounty,movieType,movieScore,scoreNum,shortFilm) " \ 
" values('%s','%0s', Ys','Y0s','Y0s', 90S 9%0S ,9%0S' \ 
"9%s','%s',%s')" 
try: 
for movie in self.movie list: 
insert_sql = insert_str % (movie[0],movie[1],movie[2],movie[3], 
movie[4],movie[5],movie[6],movie[7], 
movie[8],movie[9],movie[10]) 
# update_record(insert_sql) 
cursor.execute(insert_sql) 
except Exception as e: 
print(e) 
添加 该 方法 后 ， 可 以 将 原来 的 write_text 方法 移 除 。 
更 改 后 的 完整 代码 如 下 : 
#!/usr/bin/env python3 
#-*- coding:UTF-8 -*- 


from urllib import request 
位 om common.mysql_client import * 


import re 
class MovieTop(object): 
def _init (self): 
self.start = 0 
self.param= '&filter=" 
self.headers = {'User-Agent': 'Mozilla/$.0 (Windows NT 6.1; WOW64)'} 
self.movie list=[] 
self.file_path = 'D:\op250.txt" 
def get_page(self): 
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url = 'https://movie.douban.com/top250?start=" + str(self start) 
# url = 'https://movie.douban.com/top250?start=" + str(self.start) + self.param 


req = request.Request(url, headers = self.headers) 
response = request.urlopen(req) 

page = response.read().decode('utf-8") 

page num = (self.start + 25)//25 
print(' 正 在 抓 取 第 ' + str(page_num) + ' 页 数据 ..… ) 


self.start += 25 
return page 


except request.URLError as e: 


if hasattr(e, 'reason'): 


Print(' 抓 取 失 败 ， 失 败 原 


def get_movie_info(self): 





", €.reason) 


pattern = re.compile(u'<div.*?class="item">.*?' 


‘while self.start <= 225: 


+ u'<div.*?class="pic">.*?' 

+ u'<em.*?class="">(.*?)</em>.*?' 

+ u'<div.*?class="info">.*?' 

+ u'<span.*?class="title">(.*?)" 

+ u'</span>.*?<span.*?class="title">(.*?)</span>.*?" 
+ u'<span.*?class="other">(.*?)</span>.*?</a>.*7 
+ u'<div.*?class="bd">.*?<p.*?class="">.*?' 

+ 导演: (.*?)&nbsp;&nbsp;&nbsp;.*?<br>' 

+ u'(.*?)&nbsp;/&nbsp;(.*?)&nbsp;/&nbsp;" 

+ u'(.*?)</p>.*?<div.*?class="star">.*?' 

+ u'<span.*?' 

+ u'class="rating_ num".*?property="V:average">' 
+ u'(.*?)</span>.*?" 

十 U'.*?<span>(.*?) 人 评价 </span>.*?' 

+ u'<p.*?class="quote">.*7' 

+ u'<span.*?class="ing">(.*?)' 


+u'</span>.*?</p>", re.S) 


page = self.get_page() 
movies = re.findall(pattern, page) 


for movie in movies: 
self.movie list.append([movie[0], movie[1], 


movie[2].lstrip('&nbsp;/&nbsp;'), 
movie[3].lstrip('&nbsp;/&nbsp;'), 
movie[4], 

movie[S].Istrip(), 
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movie[6], 
movie[7].rstrip(), 
movie[8], 
movie[9], 
movie[10]]) 


def insert_into_mysql(self): 
db= pymysql.connect("localhost", "root", "root", "test") 
# 使 用 cursor() 方法 创建 一 个 游标 对 象 cursor 
cursor = db.cursor() 
insert_str = "insert into douban_comment(movieRank,movieName," \ 
"movieForName,movieAlias,directorName,show Year," \ 
"makeCounty,movieType,movieScore,scoreNum,shortFilm) " \ 
"Values('%S 9%0S' .9%6S 90S 9%0S' 90S 9%0S ,9%0S \ 
"0s','%s'," Ys')" 
try: 
for movie in self.movie list: 
insert_sql = insert_str % (movie[0],movie[1],movie[2],movie[3], 
movie[4],movie[5],movie[6],movie[7], 
movie[8],movie[9],movie[10]) 
# update_record(insert_sql) 
cursor.execute(insert_sql) 
except Exception as e: 
print(e) 


def main(self): 
print(' 开 始 从 豆瓣 电影 抓 取 数 据 ……) 
self.get_movie_info() 
self.insert_into_mysql() 
print( 数 据 抓 取 完毕 .…) 
dou_ban_spider = MovieTop() 
dou_ban_spider.main() 


执行 该 程序 ， 即 可 将 之 前 抓 取 的 数据 插入 数据 库 ， 即 实现 数据 的 持久 化 。 如 果 程 序 正确 
执行 ， 就 得 到 类 似 图 18-1 所 示 的 结果 〈 此 处 借助 MySQL-Front 客户 端 展示 ) 。 


加 PaveRank movieName moveFoName monicAlss cicoName snowYear makeCounly movelype movieSco scoreNum 














498 1 肯 申 克昌 元 睹 。。 The Shawshank F 月 时 高 漠 ) / 埋 弛 闫 克 德 拉 并 桂 F 1994 美国 犯罪 副 傅 96 740373 
4992 这 个 亲 手 不 太 坊 ”Léon 半 手 革 昂 1 终 油 过 B 克 由 松 Lue Bes 1994 3 国 出 哺 动 作 扣 里 94 711296 
5003 志 王 BE 阿里 正 传 福 二 斯 村 网 普 。 RobetZemecks 1994 关 国 副 傅 要 情 94 618276 
5015 美丽 人 生 Lavieé bella 。 一 个 快乐 的 潜 说 堵 罗 伯 托 贝 尼 尼 Rol 1997 意大利 刷 情 喜 到 委 清 。 95 354473 

己 这 BE bi 2 ES 





图 18-1 数据 持久 化 结果 
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18.2 模 块 化 


在 编写 代码 的 过 程 中 ， 或 许 你 已 经 有 一 些 感 触 了 ， 有 一 些 程序 在 多 个 方法 实现 中 都 需要 
被 重 写 ， 如 数据 库 连 接 代 码 、 文 件 操作 代码 、 邮 件 发 送 代 码 等 。 

我 们 是 否 可 以 将 这 些 代码 都 提取 出 来 ， 作 为 一 个 独立 部 分 ， 在 使 用 时 直接 调用 ， 而 不 需 
每 次 都 重复 编写 ， 也 就 是 很 多 地 方 所 说 的 重复 造 轮子 。 

基于 这 些 考 虑 ， 我 们 引入 模块 化 的 概念 。 

模块 化 是 指 解决 一 个 复杂 问题 时 自 项 向 下 逐 层 把 系统 划分 成 若干 模块 的 过 程 ， 有 多 种 属 
性 , 分 别 反 映 其 内 部 特性 。 过程 中 也 将 一 些 比 较 通 用 的 部 分 抽取 成 一 个 模块 ， 从 而 实现 公共 模 
块 的 复 用 。 

模块 化 用 来 分 割 、 组 织 和 打包 软件 。 每 个 模块 完成 一 个 特定 的 子 功能 ， 所 有 模块 按 某 种 
方法 组 装 起 来 成 为 一 个 整体 ， 完 成 整个 系统 所 要 求 的 功能 。 

在 系统 结构 中 ， 模 块 是 可 组 合 、 分 解 和 更 换 的 单元 。 模 块 化 是 一 种 处 理 复杂 系统 分 解 、 
可 以 更 好 地 管理 模块 的 方式 .模块 化 可 以 通过 在 不 同 组 件 设 定 不 同 功能 把 一 个 问题 分 解 成 多 个 
独立 、 互 相 作用 的 小 组 件 ， 从 而 处 理 复杂 的 大 型 软件 。 

各 个 模块 可 独立 工作 ， 即 便 单 组 模块 出 现 故障 也 不 影响 整个 系统 工作 。 

当 每 组 模块 达到 满 负 荷 时 ， 系 统 会 自动 启动 另 一 组 模块 ， 从 而 保证 系统 输出 始终 与 实际 
需求 匹配 ， 确 保 每 个 模块 高 效 运行 ， 又 能 节约 资源 、 提 高 效率 。 

接 下 来 将 介绍 如 何 实现 数据 库 操作 、 文 件 生成 、 邮 件 发 送 模块 化 。 


18.2.1 数据 库 操作 模块 化 


在 操作 数据 库 的 过 程 中 涉及 不 少 重 复 部 分 ， 这 部 分 可 以 抽取 出 来 。 另 外 ， 有 一 个 更 需要 
关注 的 地 方 ,之 前 的 代码 都 是 直接 在 程序 中 写 数据 库 连 接 信息 ， 这 样 很 不 安全 ， 容 易 暴 露 数据 
库 连 接 信息 。 


基于 此 ， 我 们 首先 引入 数据 库 连 接 配置 文件 。 7 本 cri 
- 般 的 做 法 是 ， 在 当前 源码 文件 中 创建 一 个 config (配置 文件 ) 
文件 夹 ， 再 在 该 文件 夹 下 创建 db.ini (名 称 可 以 随意 取 ， 建 议 取 易于 
理解 的 名 称 ) 文件 。 结 构 目录 如 图 18-2 所 示 。 图 182 配置 文件 结构 图 
在 文件 db.ini 中 配置 以 下 内 容 (以 MySQL 为 例 ， 其 他 数据 库 可 以 查阅 相关 资料 ): 
[MySQL] 
host=localhost 


User=root 











password=root 
port=3306 
schema=test 
charset=UTF8 


SS 
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创建 好 配置 文件 后 ， 接 下 来 编写 读 取 配 置 文件 的 模块 。 在 当前 源码 文件 中 创建 一 个 文件 
夹 common〔 公 共 模 块 )， 用 于 存放 这 些 公共 模块 。 

定义 一 个 模块 ， 模 块 名 为 named_tuples.py， 用 于 定义 必需 的 名 称 元 组 ， 程 序 代 码 如 下 : 

#!/usr/bin/env python3 

# -*- coding:UTF-8 -*- 

# 

# 定义 必需 的 名 称 元 组 


import collections 


# 用 于 MySQL 的 服务 信息 
MySQL = collectionsnamedtuple(MySQL' , [host, ‘user', 'password', 'port', 'charset', 'schema']) 


该 模块 定义 了 获取 MySQL 服务 必须 使 用 的 名 称 元 组 。 

接 下 来 定义 获取 配置 文件 信息 的 模块 ， 模 块 命名 为 conf_utils.py， 用 于 读 取 并 返回 配置 文 
件 的 信息 。 实 现代 码 如 下 : 

#!/usr/bin/env python3 

# -*- coding:UTF-8 -*- 

# 

# 读 取 配 置 文 件 


from common.named_tuples import MySQL 


import configparser 


class ConfigReader: 
#path 为 配置 文件 的 完整 路 径 ， 由 调用 者 传 入 
def _init (self, path): 
if path is None or len(path) < 1: 
raise ValueError('The config ini file path required.) 
else: 
self.conf = configparser.ConfigParser() 
self.conf.read(path) 


# 取得 MySQL 服务 连接 信息 ， 返 回 MySQL(host,user,password,port,charset,schema) 
def get_mysql_info(self): 

host = self.conf.get(MySQL' host) 

user= selfconf.get(MySQL','user) 

pswd = self.conf.get( MySQL.', ‘password') 

port= self.conf.get(MySQL', 'port) 

charset = self.conf.get(MySQL', 'charset') 

schema = self.conf.get(‘MySQL,', 'schema') 


return MySQL(host, user, pswd, int(port), charset, schema) 
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获得 数据 库 连 接 的 配置 文件 信息 后 ， 接 下 来 编写 数据 库 连 接 模块 和 数据 库 操 作 模块 ， 此 
处 将 模块 命名 为 mysql_client.py。 


#!/usr/bin/env python3 

# -#- coding:UTF-8 -*- 

# 

# MySQL 操作 函数 集 


from common.conf utils import ConfigReader 


import pymysql 
import datetime 


# MySQL 获取 数据 库 连 接 
def connect_pool(): 


cr = ConfigReader( 配 置 文件 绝对 路 径 /db.ini] 
conf= crget mysql_info(0) 


return pymysql.connections.Connection(host=conf.host, 
port=conf.port, 
user=conf.user, 
password=conf.password, 
database=conf.schema, 
charset=conf.charset) 


# MySQL 统一 数据 查询 方法 
def query_table(sql): 
print(Mysql client query start...') 
start = datetime.datetime.now() 
print(sql) 
result = 
try: 
conn = connect_pool() 
cur= conn.cursor() 
cur.execute(sql) 
for row in cur.fetchall(): 
result.append([cell for cell in row]) 
except Exception as e: 
Print(‘Query from MySQL table failed. Case: %s \n' % €) 
finally: 
if cur: 
cur.close() 


if conmn: 
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conn.close() 
records = len(result) 


end = datetime.datetime .now() 
print(Mysql client query completed in %s seconds. Records found: %s\n' 
% ((end - start).seconds, records)) 


return result 


# MySQL 统一 数据 更 新 方法 
def update_record(sql): 
result = 
try: 
conn = connect_pool() 
cur = conn.cursor() 
cur.execute(sql) 
except Exception as e: 
print(‘update MySQL table failed.Case:%s \n' % e) 
finally: 
conn.commit() 
if eur: 
cur.close() 
if conmn: 
conn.close() 


return 

该 模块 中 定义 了 3 个 方法 ， 第 一 个 为 数据 库 连接 方法 ， 需 要 在 这 个 方法 中 指定 配置 文件 
的 完整 路 径 ， 将 路 径 传递 给 读 取 配 置 文件 的 模块 ， 从 中 读 取 配 置 文件 信息 ， 并 通过 配置 文件 信 
息 获取 数据 库 连 接 操作 ;， 第 二 个 为 查询 方法 ， 该 方法 通过 传 入 对 应 的 sql 语句 实现 查询 操作 ， 
所 有 查询 操作 只 要 构建 好 查询 的 sql， 都 可 以 调用 该 方法 获得 查询 结果 ; 第 三 个 为 更 新 操作 方 
法 ， 该 方法 可 以 实现 插入 、 更 改 、 删 除 3 个 数据 更 新 sql 的 执行 ， 调 用 时 将 构建 好 的 sql 传 入 
该 方法 即 可 实现 。 

以 上 为 数据 库 操作 模块 化 实现 的 一 个 示例 ， 模 块 化 实现 方式 有 很 多 种 ， 大 家 可 以 根据 自 
己 的 习惯 创建 适合 的 模块 。 


18.2.2 ”文件 生成 模块 化 

此 处 将 介绍 CSV 文件 写 入 的 模块 化 实现 。 

在 项 目 实战 过 程 中 经 常会 遇 到 将 数据 处 理 结果 写 入 CSV 文件 ， 并 将 文件 通过 邮件 的 方式 
发 送 给 相关 人 员 的 情况 。 下 面 以 CSV 的 模块 化 为 例 进行 介绍 。 

模块 化 CSV 文件 生成 的 方式 比较 简单 ， 本 示例 中 将 源码 放 于 common 文件 夹 中 ， 模 块 命 
名 为 csv_utils.py， 实 现 源码 如 下 : 
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#!/usr/bin/env python3 
#-*- coding:UTF-8 -*- 
# CSV 文件 操作 工具 





import csv 


# 将 数据 写 入 CSV 文件 
def write_csv_file(path, head, data): 
try: 
with open(path, 'w', newline=") as csv_file: 
Writer = csv.writer(csv_file, dialect='excel') 
if head is not None: 
writer.writerow(head) 
for row in data: 
writer.writerow(row) 
Print("Write a CSV file to path %s Successful." % path) 
except Exception as e: 
Print("Write an CSV file to path: %s, Case: %s" % (path, e)) 
代码 中 ，path 需 包 含 生成 CSV 文件 的 路 径 和 文件 名 ; head 为 生成 的 CSV 文件 的 文件 头 ， 
可 以 根据 需要 而 定 ， 需 要 传 入 一 个 列表 ; data 为 需要 写 入 CSV 文件 的 数据 ， 也 需要 传 入 一 个 
列表 , 每 一 行 数据 对 应 一 个 列表 ,如 果 需 要 写 入 多 行 数据 ,就 需要 使 用 赚 套 列表 的 方式 传 入 数 
据 ， 列 表 中 每 一 个 元 素 为 一 个 列表 ， 对 应 写 入 文件 的 一 行 。 


18.2.3 邮件 发 送 模块 化 


18.2.2 小 节 提 到 写 好 CSV 文件 后 ， 需 要 将 文件 发 送 给 相关 人 员 。 就 意味 着 邮件 发 送 是 常 
用 操作 ， 我 们 需要 将 邮件 发 送 操作 模块 化 。 

邮件 发 送 一 般 都 涉及 发 送 附 件 ， 所 以 需要 支持 邮件 带 附件 发 送 的 模块 化 。 要 发 送 附件 就 
会 产生 不 少 元 余 文 件 , 我 们 希望 邮件 发 送 成 功 后 可 以 根据 需要 把 生成 的 原文 件 一 并 删除 , 所 以 
邮件 发 送 模块 还 需要 支持 根据 需要 自动 删除 原件 功能 。 当 文件 大 小 超过 一 定 大 小 时 , 需要 自动 
进行 压缩 ， 据 此 我 们 提供 了 文件 压缩 模块 。 

首先 实现 文件 压缩 模块 , 与 之 前 的 模块 一 样 ， 该 模块 放置 于 commen 文件 夹 下 ,模块 命名 
为 compress_utils.py， 代 码 如 下 : 

#!/usr/bin/env python3 

#-*- coding:UTF-8 -*- 

# 

# 文件 压缩 工具 

import tarfile 

import zipfile 


# 使 用 zip 方式 压缩 文件 ， 多 用 于 Windows 系统 
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def zip compress(source): 
source = source.decode('UTF-8') 
target = source[0:source.rindex(".")] + ".zip' 
try: 
with zipfile.ZipFile(target, 'w') as zip_file: 
zip_file.write(source, 
source[source.rindex('/"):], zipfile.ZIP_DEFLATED) 
zip_file.close() 
except IOError as e: 
Print(Compress file[%s] with zip model failed. Case: %s' % (source, e)) 
target = source 


return target 


# 使 用 tar 方式 压缩 文件 ， 多 用 于 Linux 系统 
def tar_ compress(source): 

source = source.decode('UTF-8') 

target = source[O0:source.rindex(".")] + ".tar.gz’ 


try: 
with tarfile.open(target, "Ww:gz") as tar_file: 
tar _file.add(source, arcname=source[source.rindex("/"):]) 
except IJOError as e: 
Print(‘Compress file[%s] with zip model failed. Case: %s' % (source, e)) 
target = source 


return target 


# 文件 压缩 率 计算 
def compress_rate(source_size, target_size): 
return round((source_size - target_size) / float(source_size), 4) 


文件 压缩 模块 实现 后 ， 接 下 来 实现 邮件 发 送 模块 ， 该 模块 也 存放 于 commen 文件 夹 下 ， 模 
块 名 称 为 email_server.py， 代 码 如 下 : 


#!/usr/bin/env python3 

# -*#- coding:UTF-8 -*- 

# 

# 邮件 服务 工具 , 能 发 送 带 附件 的 邮件 

# 邮件 发 送 成 功 后 ， 根 据 需 要 可 以 删除 附件 原件 


import datetime 
import os 
import smtplib 
import time 
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from emailmime.base import MIMEBase 

from email.mime.multipart import MIMEMultipart 
from email.mime.text import MIMEText 

from email import encoders 

from email import utils 


from common.compress_utils import zip_compress, compress_rate 


# 发 送 邮 件 函 数 

# to: 收 件 人 列表 

# cc: 抄 送 人 列表 

# subject: 邮件 主题 

# content: 邮件 内 容 

# attachments: 邮件 附件 列表 

# delete: 邮件 发 送 成 功 后 是 否 删 除 附件 原件 

def send(to, cc, subject, content, attachments, delete): 
user = "email service address" 
password = "XXXXXX" 


# 准备 邮件 服务 

server = smtplib.SMTP_SSL("smtp.163.com", 465) 
smtplib.SMTP 

server.login(user, password) 


start = datetime.datetime.now() 


content msg = MIMEMultipart() 
content_msg['From'] = user 
content_msg['To'] 





content_msg['Ce'] = 





content_msg['Subject'] = subject 
content_msg['Date'’] = utils.formatdate() 


content_msg.attach(MIME Text(content.encode("UTF-8"),_charset="UTF-8")) 
content_type = 'application/octet-stream' 
maintype, subtype = content type.split(/, 1) 


# 附件 准备 
compress_files = 
if len(attachments) > 0: 
for path in attachments: 
path = compress_attachment(path) 


mm 


如 果 有 压缩 文件 ， 就 添加 到 删除 列表 中 


mm 
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ifpath. contains ('.csv') is False: 
compress_files.append(path) 


attachment file = open(path, 'rb') 

file msg = MIMEBase(maintype, subtype) 
file_msg.set_payload(attachment file.read()) 
attachment file.close() 

encoders.encode base64(file msg) 


basename = os.path.basename(path) 

file_ msg.add_header('Content-Disposition', ‘attachment', 
filename=basename) 

content_ msg.attach(file msg) 


server.sendmail(user, to+cc, content_msg.as_string()) 
end = datetime.datetime.now() 
Print("%s Email send successful in %s seconds. To users: %s" \ 
% (time.strftime(%Y-%m-%d %H:%M:%S 
(end - start).seconds, ",".join(totcc))) 


mw 


如 果 删 除 标识 为 Tme， 且 附件 不 为 空 ， 邮 件 发 送 成 功 后 删除 附件 
try: 

attachments.extend(compress_files) 

if delete and len(attachments) > 0: 

for path in attachments: 
os.remove(path) 

except IOError as e: 

print('Delete attachments were failed. Case: %s' % e) 


except Exception as e: 


raise RuntimeError("Send email[%s] failed. Case: %s" % (subject, e)) 


finally: 


server.quit() 


def compress_attachment(attachment): 


length = os.path.getsize(attachment) 


mm 


mm 


如 果 附件 大 于 等 于 2MB， 就 压缩 附件 


if length > 4194304: 


attachment = zip_compress(attachment) 
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print('File\'s [%s] compress rate is %s%%" 
% (os.path.basename(attachment), 
compress_rate(length, os.path.getsize(attachment))* 100)) 
return attachment 


以 上 是 邮件 模块 化 的 一 些 基 本 实现 。 当 然 ， 邮 件 模块 化 的 实现 方式 有 很 多 种 ， 这 里 的 示 
例 只 是 作为 参考 。 


18.3 ”数据 分 析 的 实现 


在 编写 本 章 时 ， 刚 好 碰 上 一 年 一 度 的 购物 狂欢 节 一 一 “ 双 十 一 ”。 相 信 大 家 都 不 会 卫生 ， 
特别 是 阿里 巴巴 给 出 的 诱 人 数字 ,几乎 让 每 一 个 人 都 为 之 震颤 。 购 物 节 结束 后 ， 阿 里 给 出 了 各 
个 城市 消费 排名 、 各 个 省 份 消费 排名 、 各 个 品牌 销售 排名 、 参 与 国家 统计 、 使 用 方式 统计 等 数 
据 报告 ， 应 该 让 大 家 突然 意识 到 了 数据 分 析 的 重要 ， 也 让 大 家 意识 到 了 数据 的 魅力 。 

我 们 是 否 也 能 做 出 这 样 的 数据 分 析 呢 ? 毕 竞 我 们 手 上 也 是 有 数据 的 ， 尽 管 不 多 。 

接 下 来 使 用 手头 已 有 的 数据 ， 结 合 前 面 几 个 模块 ， 对 这 些 数据 进行 分 析 ， 生 成 一 些 比较 
直观 的 报表 。 

下 面 结合 几 个 小 情景 为 大 家 讲解 如 何 使 用 数据 。 


情景 一 : 数据 营销 


年 关 将 至 ， 意 味 着 大 家 对 娱乐 消费 的 需求 开始 增加 了 。 根 据 市 场 需求 ， 公 司 的 营销 部 门 
决定 为 大 家 推荐 一 些 评分 比较 高 的 电影 , 因此 要 求 公 司 给 出 一 份 评分 排行 榜 报表 ， 以 便于 市 场 
营销 使 用 。 

于 是 公司 向 大 数据 研发 部 门 提出 了 这 个 需求 ， 大 数据 研发 部 看 此 需求 不 是 很 难 ， 立 马 交 
由 小 菜 实现 。 小 菜 接 到 需求 ， 稍 作 分 析 ， 立 刻 想 到 可 以 应 用 数据 库 操作 模块 和 文件 生成 模块 。 
于 是 他 写 出 了 如 下 代码 : 

#!/usr/bin/env python3 

#-*- coding:UTF-8 -*- 

# coding=utf8 








from common.mysql_client import * ”#3 引入 数据 库 操作 模块 
from common.csv_utils import * # 引 入 CSV 文件 处 理 模块 


score range csv ="d:/score-range.csv" 


def movie_score_range(): 
query_sql = "select movieName,show Year,makeCounty,movieType,movieScore" \ 
" from douban comment order by movieScore desc" 
query_result = query_table(query_sql) 
Teturn query_result 
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def write_into_csv(): 
head = [电影 名 称 ,' 上 映 年 份 ' "制作 国家 ', "电影 类 别 ', ' 电 影评 分 ] 
score_range record = movie score range() 
out put data=[] 
for row in score_range record: 
out_put_data.append(row) 


write_csv_file(score range csv, head, out put data) 


def main(): 
write_into_csv() 
if_name ==" 1 
main() 
执行 以 上 程序 ， 可 以 在 d 盘 看 到 生成 了 名 为 score-range.csv 的 文件 。 打开 该 文件 ， 可 以 看 
到 文件 中 的 内 容 ， 如 图 18-3 所 示 。 
A B C D E 
电影 名 称 上 映 年 份 制作 国家 电影 类 别 电影 评分 
克 的 求 1994 美 罪 剧情 


1957 美国 
1997 意大利 


1994 法 国 
1993 美国 
2009 美国 





9. 

9. 

9. 

1994 美国 剧 9. 
9. 

9. 

9. 


图 18-3 ”评分 排行 榜 数据 


在 代码 中 使 用 了 数据 库 操作 模块 和 文件 生成 模块 ， 使 得 代码 看 起 来 很 精简 。 特 别 是 CSV 
文件 的 生成 ， 只 要 一 行 代码 就 可 以 了 。 
小 菜 满意 地 看 着 自己 的 成 果 ， 立 马 开始 写 邮件 ， 并 将 执行 得 到 的 评分 排行 数据 放 到 附件 
中 发 给 相关 人 员 。 
正当 小 菜 认为 此 事 已 经 圆满 结束 ， 打 算 着 手 另 一 件 事情 时 ， 突 然 感觉 有 些 地 方 做 得 不 够 
有 一 个 邮件 发 送 模块 这 里 没有 用 上 。 既 然 有 这 么 一 个 模块 ， 为 什么 还 要 手动 发 邮件 呢 ? 
于 是 小 菜 立 马 更 改 代码 ， 不 大 一 会 就 得 到 了 新 出 炉 的 代码 ， 代 码 如 下 : 
#!/usr/bin/env python3 
#-*- coding:UTF-8 -*- 
# coding=utf8 





好 


from common.mysql_client import * 
from common.csy_utils import * 
from common.email_server import* #3 引入 邮件 服务 模块 


score range csv ="d:/score-range.csv" 
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def movie_ score_range(): 
query_sql = "select movieName,showYear,makeCounty,movieType,movieScore" \ 
" from douban_ comment order by movieScore desc" 
query_result = query_table(query_sql) 
return query_result 


def write_into_csv(): 
head = [电影 名 称 ,' 上 映 年 份 ' "制作 国家 ', ' 电 影 类 别 ', ' 电 影评 分 "] 
score_range_ record = movie_score_range() 
out put data =[] 
for row in score_range record: 


out_put_data.append(row) 


write_csv_file(score_range_csv, head, out_put_data) 


def main(): 


write_into_csv() 


to = ['email(@aliyun.com'] 
cc=[email@aliyun.com'] 
subject = "评分 排行 榜 " 
content = "评分 排行 榜 数 据 " 


send(to, cc, subject, content, [score range_csv], True) 


if_name ==" main_": 
main() 
执行 程序 ， 可 以 看 到 相关 人 员 的 邮箱 中 收 到 如 图 18-4 所 示 的 邮件 。 
评分 排行 榜 
TPR 


yuzhouliu, yuzhoullu 


score-rangecsy DA 


评分 排行 榜 数据 





图 184 收取 邮件 形式 

点 开 附件 ， 可 以 看 到 附件 中 的 内 容 和 图 18-3 中 的 内 容 一 致 。 

在 这 段 代码 中 ， 我 们 添加 了 邮件 服务 模块 和 邮件 发 送 程 序 。 从 代码 中 可 以 看 到 ， 邮 件 发 
送 的 代码 非常 精简 ， 相 对 于 之 前 的 邮件 服务 代码 ,借助 了 邮件 服务 模块 ， 短 短 几 行 代码 就 实现 
了 邮件 发 送 功能 。 

情景 二 : 获取 区 域 性 数据 


公司 要 为 明年 多 引进 哪些 国家 的 电影 做 计划 了 ， 于 是 要 求 大 数据 研发 部 在 这 些 评分 比较 
高 的 电影 中 制作 电影 top10 是 哪些 国家 的 报表 。 
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该 任务 的 执行 者 仍然 为 小 菜 。 小 菜 有 了 前 面 的 操作 经 验 ， 这 次 处 理 起 来 更 加 得 心 应 手 。 
稍 作 分 析 ， 立 马 完成 了 功能 实现 ， 代 码 如 下 : 


#!/usr/bin/env python3 
# -#- coding:UTF-8 -*- 
# coding=utf8 


from common.mysql_client import * 
from common.csv_utils import * 
位 om common.email server import * 


topl0_make county_csv="d:/topl0-make-county.csv" 


def make_county_top10(): 
query_sql = "select makeCounty,count(1) from douban_comment " \ 
"group by makeCounty order by count(1) desc limit 10" 
query_result = query_table(query_sql) 
Teturn query_result 
def write_into_csv(): 
head =[' 制 作 国家 ', "制作 电影 数 '] 
score_range_record = make_county_top100 
out put data =[] 
for row in score_range_record: 
out_put_data.append(row) 


write_csv_file(top10_make_county_csv, head, out put_data) 


def main(): 
write_into_csv0 


to = [yuzhouliu@aliyun.com'] 

cc = [yuzhouliu@aliyun.com'] 

subject = "make county top 10" 

content = "make county top 10 data" 

send(to, cc, subject, content, [top10_make_county_csv], True) 


执行 程序 ， 可 以 看 到 如 图 18-5 所 示 的 执行 结果 。 





make county top 10 


Tees I 
2 yuzhoulu yuzhouliy 2016-11-13 17.35 hE 
i top10-make-county.cay 
make county top 10 data 





图 18-5 发 送 top 10 数据 的 邮件 
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打开 附件 ， 可 以 看 到 里 面 的 数据 详情 ， 如 图 18-6 所 示 。 

可 以 看 到 ， 得 到 了 我 们 想 要 的 结果 。 

对 比 上 面 两 个 场景 的 代码 实现 ， 虽 然 两 个 场景 的 业务 不 同 ， 但 是 有 很 多 代码 都 相同 ， 并 
且 调 用 模块 化 的 部 分 没有 发 生 改变 ， 只 不 过 传 入 的 参数 内 容 有 所 变更 。 





FE D 
1 制作 国家 制作 电影 数 
2 美国 82 
3 旧 本 27 
4 香港 10 
5 美国 英国 9 
6 韩国 9 
7 美国 德国 7 
3 英国 美国 6 
9 英国 5 
10 美国 加 拿 4 
11 香港 中 国 4 





图 18-6 数据 详情 


由 此 我 们 得 知 ， 通 过 模块 化 和 非 模块 化 操作 的 对 比 ， 业 务 变 更 时 需要 变更 很 少 代码 即 可 
实现 新 的 业务 需求 。 

此 处 只 列举 了 两 个 简单 的 示例 ， 大 家 可 以 进行 更 多 练习 ， 如 参评 人 数 的 分 析 ， 上 映 年 份 
的 分 析 ， 电 影 名 称 与 上 映 年 份 、 制 作 国 家 、 参 评 人 数 等 关联 关系 的 分 析 。 


18.4 项 目 小 结 


本 章 前 面 讲解 了 代码 结构 模块 化 的 思想 ， 后 面 通过 数据 分 析 的 简单 示例 将 这 些 模块 加 以 
应 用 。 

这 里 的 示例 只 是 简单 的 数据 分 析 ， 所 使 用 的 数据 也 比较 简单 。 对 于 学 有 余力 的 读者 ， 可 
以 抓 取 更 多 数据 进行 深入 分 析 。 
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A.1 数学 函数 

函数 返回 值 ( 描 述 ) 
abs(x) 返回 数字 的 绝对 值 ， 如 abs(-10) 返回 10 
ceil(x) 返回 数字 的 上 入 整数 ， 如 math.ceil(4.1) 返回 5 
cmp(x, y) 如 果 x<y 就 返回 -1， 如 果 x==y 就 返回 0， 如 果 x>y 就 返回 1 
exp(x) 返回 e 的 x 次 寡 c9]， 如 math.exp(1) 返回 2.718281828459045 
fabs(x) 返回 数字 的 绝对 值 ， 如 math.fabs(-10) 返回 10.0 
floor(x) 返回 数字 的 下 使 整数 ， 如 math.floor(4.9) 返 回 4 
log(x) 如 math.log(math.e) 返 回 1.0，math.log(100,10) 返 回 2.0 
log10(x) 返回 以 10 为 基数 的 x 的 对 数 ， 如 math.log10(100) 返 回 2.0 


max(x1, x2,…) ”| 返回 给 定 参数 的 最 大 值 ， 参 数 可 以 为 序列 





min(x1, x2,..) 返回 给 定 参数 的 最 小 值 ， 参 数 可 以 为 序列 












































modf(x) 返回 x 的 整数 部 分 与 小 数 部 分 ， 两 部 分 的 数值 符号 与 x 相同， 整数 部 分 以 浮 点 型 表示 
pow(x, y) x**y 运算 后 的 值 
round(x [,n]) 返回 浮 点 数 x 的 四 合 五 入 值 ， 如 给 出 n 值 ， 代 表 舍 入 到 小 数 点 后 的 位 数 
sqrt(x) 返回 数字 x 的 平方 根 ， 数 字 可 以 为 负数 ， 返 回 类 型 为 实数 ， 如 math.sqrt(4) 返 回 2+0j 
A.2 随机 函数 
函数 描述 
eed) 从 序列 的 元 素 中 随机 挑选 一 个 元 素 ， 如 random.choice(range(10))， 从 0~9 中 随 
机 挑选 一 个 整数 。 
randrange ([start,] stop [,step]) | 从 指定 范围 按 指定 基数 递增 的 集合 获取 一 个 随机 数 ， 基 数 缺 省 值 为 1 
random() 随机 生成 下 一 个 实数 ， 在 [0,1) 范 围 内 
改变 随机 数 生成 器 的 种 子 seed。 如 果 不 了 解 原理 , 就 不 必 特 意 设 定 seed, Python 
en 会 玫 你 选择 seed 
shuffle(lst) 将 序列 所 有 元 素 随 机 排序 
uniform(x, y) 随机 生成 下 一 个 实数 ， 在 [x,y] 范 围 内 
A.3 三 角 函 数 
函数 描述 
acos(X) 返回 x 的 反 余弦 弧度 值 
asin(x) 返回 x 的 反正 弦 弧 度 值 

















Python 3.5 从 零 开 始 学 



































( 续 表 ) 
函数 描述 
atan(x) 返回 x 的 反正 切 弧度 值 
atan2(y, x) 返回 给 定 的 x 及 ”坐标 值 的 反正 切 值 
cos(x) 返回 x 弧度 的 余弦 值 
hypot(x, y) 返回 欧 几 里 得 范 数 sqrt(x*x + y*y) 
sin(x) 返回 x 弧度 的 正弦 值 
tan(x) 返回 x 弧度 的 正切 值 
degrees(x) 将 弧度 转换 为 角度 ， 如 degrees(math.pi/2) 返 回 90.0 
radians(x) 将 角度 转换 为 弧度 


A.4 Python 字符 串 内 建 函 数 


序号 方法 及 描述 
1 capitalize0， 将 字符 串 的 第 一 个 字符 转换 为 大 写 
2 center(width, fillchar) 返 回 一 个 指定 宽度 width 居中 的 字符 串 ，fillchar 为 填充 的 字符 ， 默 认为 空格 





count(str, beg= 0,end=len(string)) 返 回 str 在 string 里 出 现 的 次 数 ， 如 果 beg 或 end 指定 ， 就 返回 指 
定 范围 内 str 出 现 的 次 数 
4 decode(encoding=UTF-8',errors='strict) 使 用 指定 编码 解码 字符 串 。 默 认 编码 为 字符 串 编码 





encode(encoding=UTF-8,errors='strict) 以 encoding 指定 的 编码 格式 编码 字符 串 ， 如 果 出 错 默认 报 一 
个 ValueError 异常 ， 除 非 errors 指定 的 是 ignore 或 者 replace 
endswith(suffix, beg=0, end=len(string)) 检 查 字 符 串 是 否 以 obj 结束 。 如 果 beg 或 end 指定 ， 就 检查 
指定 的 范围 内 是 否 以 obj 结束 。 如 果 是 ， 就 返回 True; 否则 返回 False 
7 expandtabs(tabsize=8) 把 字符 串 string 中 的 tab 符号 转 为 空格 ，tab 符号 默认 的 空格 数 是 8 
find(str, beg=0 end=len(string)) 检 测 str 是 否 包 含 在 字符 串 中 。 如 果 beg 和 end 指定 范围 ， 就 检查 是 
和 否 包 含 在 指定 范围 内 。 如 果 是 ， 就 返回 开始 的 索引 值 ， 否 则 返回 -1 

9 index(str, beg=0, end=len(string)) 跟 find0 方 法 一 样 ， 只 不 过 如 果 str 不 在 字符 串 ， 就 中 会 报 一 个 异常 





10 “| isanum()， 如 果 字 符 串 至 少 有 一 个 字符 并 且 所 有 字符 都 是 字母 或 数字 ， 就 返回 True; 否则 返回 False 








11 isalpha0， 如 果 字 符 串 至 少 有 一 个 字符 且 所 有 字符 都 是 字母 ， 就 返回 True; 否则 返回 False 





12 “| isdigit0， 如 果 字 符 串 只 包含 数字 ， 就 返回 True; 否则 返回 False.. 





islower0)， 如 果 字 符 串 中 包含 至 少 一 个 区 分 大 小 写 的 字符 ， 并 且 所 有 字符 《〈 区 分 大 小 写 ) 都 是 小 写 ， 
就 返回 True; 否则 返回 False 








14 isnumeric()， 如 果 字 符 串 中 只 包含 数字 字符 ， 就 返回 True; 否则 返回 False 





15 isspace0， 如 果 字 符 串 中 只 包含 空格 ， 就 返回 True; 否则 返回 False 





16 “| istitle()， 如 果 字 符 串 是 标题 化 的 ( 见 title0)， 就 返回 True;， 否则 返回 False 





isupper()， 如 果 字 符 串 中 包含 至 少 一 个 区 分 大 小 写 的 字符 ， 并 且 所 有 字符 (区 分 大 小 写 ) 都 是 大 写 ， 
就 返回 True; 否则 返回 False 
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( 续 表 ) 

序号 方法 及 描述 
18 “| joinGeqj， 以 指定 字符 串 作为 分 隔 符 ， 将 seq 中 所 有 元 素 〈 字 符 串 表示 ) 合并 为 一 个 新 字符 串 
19 “| len(string)， 返 回 字符 串 长 度 
ljust(width[, fillchar]), 返回 左 对齐 的 原 字符 串 , 并 使 用 fillchar 填充 至 长 度 width 的 新 字符 串 , fillchar 
默认 为 空格 
21 ”| lower()， 转 换 字符 串 中 所 有 大 写字 符 为 小 写 
22 “| Istrip0， 截 掉 字 符 串 左边 的 空格 
maketrans(), 创建 字符 映射 的 转换 表 , 对 于 接收 两 个 参数 的 最 简单 的 调用 方式 , 第 一 个 参数 是 字符 串 ， 
表示 需要 转换 的 字符 ， 第 二 个 参数 也 是 字符 串 ， 表 示 转 换 的 目标 

24 “| max(str)， 返 回 字 符 串 str 中 最 大 的 字母 

25 min(str)， 返 回 字符 串 str 中 最 小 的 字母 

26 replace(old, new [, max]), 把 将 字符 串 中 的 strl 替换 成 str2。 如果 max 指定 , 替换 就 不 超过 max 次 

27 “| rfind(str, beg=0,end=len(string))， 类 似 于 find0 函 数 ， 不 过 是 从 右边 开始 查找 

28 | rindex( str, beg=0, end=len(string))， 类 似 于 index0 函 数 ， 不 过 是 从 右边 开始 查找 
rjust(width,[, fillchar])， 返 回 右 对 齐 的 原 字 符 串 ， 并 使 用 fillchar 〈 默 认 空 格 ) 填充 至 长 度 width 的 新 
字符 串 
30 “| rstrip0)， 删 除 字符 串 末 尾 的 空格 
split(str="", num=string.count(str))，num=string.count(str)) 以 str 为 分 隔 符 截 取 字 符 串 。 如 果 num 有 
指定 值 ， 就 仅 截取 num 个 子 字符 串 
splitlines( num=string.count(m'))， 按 照 行 分 隔 ， 返 回 一 个 包含 各 行 元 素 的 列表 。 如 果 num 指定 ， 就 
仅 切 片 num 个 行 
startswith(str, beg=0,end=len(string))， 检 查 字符 串 是 否 以 obj 开头 ， 是 就 返回 True， 和 否则 返回 False。 
如 果 beg 和 end 为 指定 值 ， 就 在 指定 范围 内 检查 
34 ”| strip([chars])， 在 字符 串 上 执行 lstrip0 和 rstrip() 
35 “| swapcase()， 将 字符 串 中 的 大 写 转 换 为 小 写 ， 小 写 转换 为 大 写 
36 “| title0， 返 回 “ 标 题 化 ”的 字符 串 ， 就 是 所 有 单词 都 以 大 写 开 始 ， 其 余 字 母 均 为 小 写 ( 见 istitle0) 
translate(table，deletechars="")， 根 据 str 给 出 的 表 (包含 256 个 字符 ) 转换 string 的 字符 ， 将 要 过 
滤 的 字符 放 到 deletechars 参数 中 
38 “| upper()， 转 换 字 符 串 中 的 小 写字 母 为 大 写 
39 “| zfill (width)， 返 回 长 度 为 width 的 字符 串 ， 原 字符 串 右 对 齐 ， 前 面 填充 0 
40 isdecimal()， 检 查 字 符 串 是 否 只 包含 十 进 制 字 符 ， 如 果 是 就 返回 Tme， 否 则 返回 False 




































































A.5 ”列表 方法 


序号 方法 
1 | listappend(obj)， 在 列表 末尾 添加 新 对 象 


2 | iisteount(ob)， 统 计 菜 个 元 素 在 列表 中 出 现 的 次 数 
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( 续 表 ) 
序号 方法 
3 listextend(seq)， 在 末尾 一 次 性 追加 另 一 序列 中 多 个 值 ( 用 新 列表 扩展 原来 的 列表 ) 
4 listindex(obj)， 从 列表 中 找 出 某 个 值 第 一 个 匹配 项 的 索引 位 置 
5 list.insert(index, obj)， 将 对 象 插入 列表 
6 list.pop(obj=list[-1])， 移 除 列表 中 一 个 元 素 默 认为 最 后 一 个 )， 并 返回 该 元 素 的 值 
7 listremove(obj)， 移 除 列表 中 某 个 值 的 第 一 个 匹配 项 
8 listreverse0， 反 向 列表 中 的 元 素 
9 list.sort([func])， 对 原 列表 进行 排序 
10 “| listclear0， 清 空 列表 
11 listcopy0， 复 制 列 表 
A.6 字典 内 置 方法 
序号 函数 及 描述 
1 radiansdict.clear)， 删 除 字典 内 所 有 元 素 
2 radiansdict.copy()， 返 回 一 个 字典 的 浅 复制 
3 radiansdict.fromkeys()， 创 建 一 个 新 字典 ， 以 序列 seq 中 的 元 素 做 字典 的 键 ，val 为 字典 所 有 键 对 应 
的 初始 值 
4 radiansdict.get(key, default=None)， 返 回 指定 键 的 值 ， 如 果 值 不 在 字典 中 ， 就 返回 default 
5 key in dict， 如 果 键 在 字典 dict 里 ， 就 返回 true， 和 否则 返回 false 
6 radiansdict.items()， 以 列表 返回 可 遍历 的 元 组 数组 ( 键 , 值 ) 
7 radiansdictkeys0， 以 列表 返回 一 个 字典 所 有 键 
radiansdict.setdefault(key, default=None)， 和 get0 类 似 ， 如 果 键 不 存在 于 字典 中 ， 就 会 添加 键 并 将 值 
设 为 default 
9 radiansdict.update(dict2)， 把 字典 dict2 的 键 / 值 对 更 新 到 dict 里 
10 radiansdict.values()， 以 列表 返回 字典 中 所 有 值 
A.7 ”正则 表达 式 模式 
模式 描述 
匹配 字符 串 的 开头 
$ 匹配 字符 串 的 末尾 





匹配 任意 字符 ， 除 了 换行 符 ， 当 re.DOTALL 标记 被 指定 时 ， 可 以 匹配 包括 换行 符 的 任意 字符 





用 来 表示 一 组 字符 ， 单 独 列 出 : [amk] 匹配 'a''m 或 kk 








不 在 0 中 的 字符 : [^abc] 匹配 除了 a、b、c 之 外 的 字符 
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( 续 表 ) 
模式 描述 
re* 匹配 0 个 或 多 个 表达 式 
ret 匹配 1 个 或 多 个 表达 式 
re? 匹配 0 个 或 1 个 由 前 面 的 正则 表达 式 定义 的 片段 ， 非 贪 林 方式 
ref{fn,} 精确 匹配 前 面 n 个 表达 式 
ref nm} 匹配 n 到 m 次 由 前 面 的 正则 表达 式 定 义 的 片段 ， 贪 禁 方式 
alb 匹配 a 或 b 
(re) 匹配 括号 内 的 表达 式 ， 也 表示 一 个 组 
(Yimx) 正则 表达 式 包含 3 种 可 选 标志 : i、m、x 。 只 影响 括号 中 的 区 域 
(?-imx) 正则 表达 式 关 闭 i、m、x 可 选 标志 。 只 影响 括号 中 的 区 域 
(2:re) 类 似 (.…)， 但 不 表示 一 个 组 
(Yimx: re) | 在 括号 中 使 用 i、m、x 可 选 标志 
(?-imx: re) | 在 括号 中 不 使 用 i、m、x 可 选 标志 
(2#...) 注释 
ou 前 向 肯定 界定 符 。 如 果 所 含 正则 表达 式 以 … 表示 , 在 当前 位 置 成 功 匹 配 时 就 会 成 功 , 否则 失败 。 
| 一 旦 所 含 表达 式 已 经 尝试 ， 匹 配 引擎 根本 没有 提高 ， 模 式 的 剩余 部 分 还 要 尝试 界定 符 的 右边 
(2?!re) 前 向 否定 界定 符 。 与 肯定 界定 符 相 反 ， 当 所 含 表达 式 不 能 在 字符 串 当前 位 置 匹配 时 成 功 
(>re) 匹配 的 独立 模式 ， 省 去 回溯 
Ww 匹配 字母 数字 
WwW 匹配 非 字母 数字 
\s 匹配 任意 空白 字符 ， 等 价 于 [mwefl 
\S 匹配 任意 非 空 字符 
\d 匹配 任意 数字 ， 等 价 于 [0-9] 
\D 匹配 任意 非 数 字 
Ww 匹配 字符 串 开始 
也 匹配 字符 串 结束 ， 如 果 存 在 换行 ， 就 只 匹配 到 换行 前 的 结束 字符 串 
忆 匹配 字符 串 结束 
\G 匹配 最 后 完成 的 位 置 
匹配 一 个 单词 边界 ， 也 就 是 单词 和 空格 间 的 位 置 。 例 如 ， 'erb' 可 以 匹配 "never" 中 的 'er， 但 不 
能 匹配 "verb" 中 的 'er 
\B 匹配 非 单词 边界 。'enB' 能 匹配 "verb” 中 的 'er， 但 不 能 匹配 "never" 中 的 'er 
nn \ un 匹配 一 个 换行 符 ，\t 匹配 一 个 制 表 符 








匹配 第 n 个 分 组 的 子 表达 式 
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结 束 语 


至 此 ， 本 书 就 结束 了 。 

如 果 把 一 门 语言 比 作 一 股 水 流 ， 本 书 能 够 充当 引导 水 流 流 入 河流 的 向 导 。 笔 者 希望 在 进 
入 河流 后 不 要 停 下 脚步 ， 而 是 继续 往 前 流 消 ， 穿 过 河流 ,直到 抵达 海洋 ， 那 里 才 是 你 应 该 驻足 
的 地 方 。 

在 本 书 结束 之 际 ， 感 谢 清 华 大 学 出 版 社 的 王 金 柱 编辑 ， 在 本 书 编写 的 过 程 中 ， 王 编辑 给 
予 了 很 多 指导 和 修改 意见 。 同 时 感谢 家 人 和 朋友 在 写作 期 间 给 予 的 安静 写作 环境 , 让 笔者 不 被 
更 多 琐事 打扰 ， 从 而 专心 于 写作 。 感 谢 你 们 ， 没 有 你 们 的 帮助 与 关心 ， 本 书 不 能 如 期 完成 。 
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